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本 书 的 主旨 是 为 读者 提供 对 现 有 的 和 将 来 的 程序 设计 语言 进行 客观 评价 所 需要 的 方法 和 思路 ， 增 强 
读者 学 习 新 语言 的 能 力 并 理解 语言 的 实现 。 本 书 从 学 习 程 序 设 计 语言 的 原因 、 常 用 程序 设计 语言 的 演化 
史 、 评 估 程 序 设计 语言 结构 的 标准 ， 以 及 这 些 语言 基本 的 实现 方法 开始 讲 起 ， 通 过 不 局 限于 特定 语言 
类 地 分 析 语 言 结构 的 设计 问题 ,检测 设计 选择 ,以 及 比较 设计 可 选 方案 来 讲述 程序 设计 语言 基本 原理 。 本 
书 并 非 讲授 如 何 使 用 一 门 语言 ， 而 是 讨论 语言 的 结构 、 特 性 及 其 在 各 种 情景 中 的 设计 和 实现 以 及 如 何 根 
据 给 定 的 任务 选择 合适 的 语言 。 


本 书 特点 及 新 增 内 容 : | 
o 把 程序 设计 语言 Python 和 Ruby 融 入 相关 章节 。 
© 修改 了 关于 操作 语义 的 内 容 。 
o 新 增 有 天 支持 Java 5.0 和 C# 2005 泛 型 类 的 内 容 。 
o 涵盖 了 当代 语言 (包括 C# 、Java、JavaScript、Perl|、PHP、Python 和 Ruby 等 ) 有 趣 而 重要 
@ 收录 了 James Gosling, Larry Wall, Alan Cooper, Bjarne Stroustrup 等 人 的 访谈 。 
e 以 Prolog 语 言 为 例 ， 剖 析 了 远 辑 程序 设计 语言 。 
e 讨论 了 包括 Scheme 和 ML 在 内 的 函数 式 程序 设计 语言 。 
© 将 面 问 对 象 和 非 面 向 对 象 的 命令 式 程 序 设计 语言 结合 起 来 讨论 。 
@ 提供 了 产生 现 有 语言 的 特定 设计 选择 的 历史 背景 。 
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= ae 习 程序 设计 语言 入 手 ， We 命令 式 语言 的 主要 结构 及 其 
计 与 实 ARBETA KORATI., ZOAT AA Pemba), TFET, ‘anne 
till, ee (继承 和 动态 方法 绑 定 )、 a 最 后 册 草 介绍 
了 国 数 式 程序 设计 语言 和 逻辑 程序 设计 语言 。 
本 书 内 容 丰 富 ， 剖 析 透 彻 ， 被 美国 和 加 拿 大 多 所 高 等 院 校 采用 作为 教材 。 本 书 既 可 用 做 
高 等 院 校 计算 机 及 相关 专业 本 科 生 程序 设计 语言 课程 的 教材 和 参考 书 ， 也 可 供 程 序 设 计 人 员 
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出 版 者 的 话 


文艺 复兴 以 降 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 各 
个 领域 取得 了 垄断 性 的 优势 ， 也 正 是 这 样 的 传统 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 闻名 家 
埋 出 、 独 领 风 骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 计 算 机 学 
科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科学 著作 ， 不 仅 壁 划 
了 研究 的 范畴 ， 还 揭 更 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 因 
年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ,我 国 的 计算 机 产业 发 展 迅 猛 ， 对 专业 人 才 的 需求 日 
一 迫切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ， 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技 术 发 展 时 间 较 短 、 从 业 人 员 较 少 的 现状 下 ， 美 国 等 发 达 国 家 
在 其 计算 机 科学 发 展 的 几 十 年 间 积淀 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国 
外 优秀 计算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 
设 真 正 的 世界 一 流 大 学 的 必由之路 。 

机 械 工业 出 版 社 华章 图 文 信息 有 限 公 司 较 早 意 识 到 “出 版 要 为 教育 服务 ”"。 自 1998 年 开始 ， 
华章 公司 就 将 工作 重点 放 在 了 遂 选 、 移 译 国 外 优秀 教材 上 。 经 过 几 年 的 不 懈 努 力 ， 我 们 与 
Prentice Hall, Addison-Wesley, McGraw-Hill, Morgan Kaufmann 等 世界 著名 出 版 公司 建立 了 
民 好 的 合作 关系 ， 从 它们 现 有 的 数 百 种 教材 中 甄选 出 Tanenbaum，Stroustrup ，Kernighan ， 
Jim Gray 等 大 师 名 家 的 一 批 经 典 作品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 
究 及 废 藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 从 书 的 品位 和 格调 。 

计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 易 力 训 助 ， 国 内 的 专家 不 仅 提供 了 中 
肯 的 选 题 指 导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ， 而 原 书 的 作者 也 相当 关注 其 作品 在 
中 国 的 传播 ， 有 的 还 专程 为 其 书 的 中 译本 作 序 。 迄 今 ,“ 计 算 机 科学 丛书” 已 经 出 版 了 近 百 个 
品种 ， 这 些 书 籍 在 读者 中 树立 了 和 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书籍 ， 为 
进一步 推广 与 发 展 打 下 了 坚实 的 基础 。 

随 着 学 科 建 设 的 初步 完善 和 教材 改革 的 逐渐 深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 
用 都 步 入 一 个 新 的 阶段 。 为 此 ， 华 章 公司 将 加 大 引进 教材 的 力度 ， 在 “华章 教育 ”的 总 规划 
之 下 出 版 三 个 系列 的 计算 机 教材 : 除 “ 计 算 机 科学 丛书 ”之 外 ， 对 影印 版 的 教材 ， 则 单独 开 
辟 出 “经 典 原 版 书库 ”， 同 时 ， 引 进 全 美 通行 的 教学 辅导 书 “Schaum's Outlines” 系 列 组 成 
全美 经 典 学 习 指 导 系 列 ”。 为 了 保证 这 三 套 丛 书 的 权威 性 ， 同 时 也 为 了 更 好 地 为 学 校 和 老师 
们 服务 ， 华 章 公 司 聘请 了 中 国 科学 院 、 北 京 大 学 、 清 华 大 学 、 国 防 科技 大 学 、 复 日 大 学 、 上 
海 交 通 大 学 、 南 京 大 学 、 浙 江 大 学 、 中 国 科技 大 学 、 哈 尔 滨 工业 大 学 、 西 安 交 通 大 学 、 中 国 
人 民 大 学 、 北 京 航空 航天 大 学 、 北 京 邮电 大 学 、 中 山大 学 、 解 放 军 理工 大 学 、 郑 州 大 学 、 湖 
北 工 学 院 、 中 国 国家 信息 安全 测评 认证 中 心 等 国内 重点 大 学 和 科研 机 构 在 计算 机 的 各 个 领域 
的 著名 学 者 组 成 “专家 指导 委员 会 "， 为 我 们 提供 选 题 意见 和 出 版 监督 。 

这 三 侠 从 书 是 响应 教育 部 提出 的 使 用 外 版 教材 的 号 召 ， 为 国内 高 校 的 计算 机 及 相关 专业 的 
教学 度 身 订 造 的 。 其 中 许多 教材 均 已 为 M. L T., Stanford, U.C. Berkeley，C. M. U. 等 世界 名 
牌 大 学 所 采用 。 不 仅 涵 盖 了 程序 设计 、 数 据 结构 、 操 作 系 统 、 计 算 机 体系 结构 、 数 据 库 、 编 译 
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原理 、 软 件 工程 、 图 形 学 、 通 信 与 网 络 、 离 散 数学 等 国内 大 学 计算 机 专业 普遍 开设 的 核心 课程 ， 
而 且 各 具 特 色 一 一 有 的 出 自 语言 设计 者 之 手 、 有 的 历经 三 十 年 而 不 衰 、 有 的 已 被 全 世界 的 几 百 
所 高 校 采 用 。 在 这 些 圆 熟 通 博 的 名 师 大 作 的 指引 之 下 ， 读 者 必 将 在 计算 机 科学 的 宫殿 中 由 登 党 
mA. 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 ， 但 我 们 的 目标 是 尽善尽美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 
的 重要 帮助 。 教 材 的 出 版 只 是 我 们 的 后 续 服 务 的 起 点 。 华 章 公司 欢迎 老师 和 读者 对 我 们 的 工 
作 提 出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


电子 邮件 : hzjsj@hzbook.com 

联系 电话 : (010) 68995264 

联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 1 有 8 
邮政 编码 : 100037 
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本 书 是 一 本 在 美国 、 加 拿 大 得 到 广泛 使 用 的 大 学 教材 ， 适 用 于 计算 机 科学 或 计算 机 工程 专 
业 本 科 二 、 三 年 级 开设 的 程序 设计 语言 课程 。 本 书 已 升级 至 第 8 版 ， 多 次 再 版 的 事实 足以 说 明 其 
受 欢 迎 的 程度 。 一 本 书 的 市 场 价值 往往 能 够 反映 出 它 在 技术 上 的 价值 ， 本 书 就 是 如 此 。 

计算 机 科学 的 各 个 方面 都 离 不 开 程 序 设 计 语言 。 计 算 机 工作 者 一 生 中 必然 会 接触 好 几 种 语 
言 : 当 一 种 新 的 语言 问世 并 被 广泛 接受 时 ， 你 需要 学 习 这 种 语言 以 更 新 技能 ， 当 接手 一 个 新 项 
目 时 ， 你 必须 为 这 个 项 目 选 择 一 种 最 合适 的 实现 语言 ， 其 至 你 可 能 会 为 它 专门 设计 并 实现 一 种 
新 的 语言 。 本 书 并 不 教授 如 何 使 用 一 种 语言 ， 而 是 讨论 程序 设计 语言 的 结构 与 特性 、 这 些 结构 
与 特性 在 不 同 语言 中 的 设计 与 实现 以 及 这 些 结 构 与 特性 带 给 语言 的 优点 与 缺 上 后。 笛 握 了 这 些 知 
ik, 会 让 读者 在 学 习 新 的 语言 时 有 一 种 “似曾相识 ”的 感觉 ， 并 很 快 掌握 该 语言 中 的 许多 特性 。 
当 读 者 需要 选择 一 种 语言 时 ， 可 以 根据 各 种 语言 的 适用 性 及 它们 的 优 缺 上 做 到 知 “ 语 ” 善 用 ， 
当 其 需要 构造 一 种 新 语言 时 ， 也 会 知道 应 该 从 何 处 着 手 来 选择 出 最 优 的 设计 实现 方案 。 男 外 ， 
本 书 所 提供 的 关于 语言 “内 部 ”结构 的 设计 与 实现 的 知识 ， 正 是 大 多 数 介绍 语言 使 用 方法 的 书 
籍 所 欠缺 的 。 这 种 知识 能 够 让 读者 将 一 种 语言 的 优点 充分 地 发 挥 出 来 ， 并 且 避 免 该 语言 本 身 的 
缺点 可 能 带 来 的 种 种 问题 。 

本 书 的 主要 内 容 可 分 为 四 部 分 。 第 一 部 分 包括 第 1 章 和 第 2 章 ， 第 二 部 分 包括 第 3 章 和 第 4 章 ， 
第 三 部 分 从 第 5$ 章 到 第 14 章 ， 第 四 部 分 包括 第 15 章 和 第 16 章 。 

在 第 一 部 分 中 ， 第 1 章 介 绍 一 些 预备 性 的 基础 知识 。 第 2 章 是 对 程序 设计 语言 的 历史 进行 
趣 而 引人入胜 的 回顾 ， 这 一 章 介 绍 了 一 种 在 第 二 次 世界 大 战 期 间 由 德国 开发 的 功能 十 分 齐全 、 
但 鲜 为 人 知 的 语言 一 一 Plankalk 计 语言 ， 还 介绍 了 Fortran 语 言 的 巨大 成 功 及 其 深远 的 影响 ， 还 包 
括 ALGOL、COBOL、Pascal、Ada、C、C++、Java、C#、JavaScript、PHP、Python 和 Ruby 等 语 
言 ， 所 有 重要 的 语言 几乎 都 涉及 了 ， 本 章 为 程序 设计 语言 描绘 了 一 个 完整 的 家 谱 ， 在 这 里 ， 各 
种 语言 的 来 龙 去 脉 变 成 了 一 幅 靖 晰 的 画卷 。 

在 第 二 部 分 中 ， 第 3 章 是 关于 语法 和 语义 的 描述 ， 语 法 和 语义 是 语言 中 的 两 大 要 素 ， 这 一 章 
讨论 对 程序 设计 语言 的 语法 和 语义 进行 形式 描述 的 方法 。 第 4 章 简 明 地 介绍 了 程序 设计 语言 的 编 
译 原理 ， 这 一 章 是 专门 为 不 开设 编译 技术 课程 的 学 校 而 编写 的 。 然 而 实际 上 ， 即 使 你 打算 去 哺 
一 本 编译 技术 的 大 部 头 书 ， 或 者 是 准备 学 习 一 门 编译 课程 ， 这 一 章 也 很 值得 读 一 读 。 它 会 让 你 
事先 获得 编译 技术 的 概貌 ， 而 不 至 于 一 头 扎 入 大 量 的 技术 细 市 当中 ， 导 致 “不 识 庐 山 真面目 ”。 

第 三 部 分 集中 了 本 书 精华 的 部 分 。 这 一 部 分 详细 地 剖析 语言 的 各 个 组 成 部 分 设计 的 实现 。 
程序 设计 语言 的 主要 组 成 部 分 包括 变量 、 类 型 、 表 达 式 、 赋 值 语句 、 控 制 结构 、 子 程序 、 并 发 、 
异常 处 理 等 。 对 于 语言 的 每 一 个 组 成 部 分 ， 本 书 首先 讨论 其 必要 性 ， 接 着 分 析 设 计 中 必须 解决 
的 问题 ， 然 后 列 出 了 各 种 不 同 的 解决 方法 ， 并 评价 了 各 种 方法 的 优 缺 点 ， 讨 论 了 一 些 重要 语言 
中 具体 的 设计 实现 。 在 读 完 这 一 部 分 之 后 ， 一 门 语言 将 不 再 是 一 个 黑 盒 子 ， 而 像 是 在 硬件 高 手 
面前 打开 了 盖子 的 一 台 计 算 机 。 各 个 部 分 的 特征 、 优 劣 以 及 对 整体 性 能 的 影响 都 变 得 清 清 楚楚 ， 
这 些 与 语言 有 关 的 知识 对 于 编写 可 徘 高 效 的 程序 将 是 极 有 帮助 的 。 例 如 ， 如 果 一 位 程序 员 了 解 
他 所 使 用 的 语言 中 调用 子 程序 的 代价 ， 他 就 能 根据 对 程序 速度 和 程序 模块 化 的 特定 要 求 来 决定 
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是 否 使 用 递归 子 程序 。 同 样 ， 如 果 一 位 程序 员 熟 悉 他 所 使 用 的 语言 中 的 变量 引用 环境 ， 他 的 程 
序 中 由 于 变量 引用 错误 而 产生 的 “疑难 病症 ”就 会 少 得 多 。 有 时 ， 这 些 知识 还 能 帮助 你 判断 出 
编译 器 内 部 的 错误 ， 使 你 从 盲目 地 挑剔 那些 无 辜 程序 的 思维 中 解放 出 来 。 

第 四 部 分 介绍 两 种 “另类 ”的 语言 : 以 LISP 为 代表 的 函数 式 语言 以 及 逻辑 程序 设计 语言 
Prolog ， 它 们 都 是 人 工 智 能 语言 ， 而 此 前 所 讨论 的 语言 都 属于 命令 式 语 言 。 命 令 式 语言 的 程序 
向 机 器 发 出 一 条 条 可 执行 的 命令 语句 。 然 而 ， 在 函数 式 和 逻辑 程序 设计 语言 中 ， 程 序 设计 却 遵 
循 一 种 完全 不 同 的 思维 方式 ， 连 算法 设计 都 大 相 径 庭 。 在 这 些 语 言 里 ， 没 有 我 们 熟悉 的 、 必 不 
可 少 的 赋值 语句 、 循 环 语句 等 。 使 用 这 些 语言 时 ， 程 序 设计 不 再 能 够 先 画 框图 ， 然 后 将 每 一 个 
框图 翻译 成 一 条 或 几 条 命令 语句 。 函 数 式 程序 设计 通过 函数 调用 来 解决 问题 ， 逻 辑 程 序 设 计 则 
是 通过 逻辑 推理 来 解决 问题 。 在 这 两 章 中 ， 作 者 举 了 几 个 很 好 的 例子 ， 让 你 很 容易 转换 思维 ， 
接受 这 两 种 不 同 的 方式 ， 另 外 还 给 出 了 十 分 巧妙 的 算法 来 解决 传统 的 问题 ， 它 们 会 帮助 你 拓宽 
解决 问题 的 思路 。 也 许 在 下 一 个 项 目 中 ， 这 两 种 程序 设计 的 知识 能 够 使 你 在 解决 问题 时 另 辟 蹊 
径 ， 获 取出 人 意料 的 成 功 。 

本 书 还 收录 了 与 一 批 著 名 的 计算 机 科学 家 进行 的 有 趣 而 生动 的 访谈 ， 其 中 还 有 C++、Java_ 
PHP、Perl 等 语言 的 作者 ， 他 们 在 程序 设计 语言 上 的 卓越 贡献 对 计算 机 事业 的 发 展 产生 了 巨大 的 
影响 。 从 这 些 访谈 之 中 ， 我 们 可 以 了 解 到 这 些 科 学 家 们 丰富 的 成 长 经 历 、 独 特 的 思维 方式 对 
问题 的 深刻 见解 ， 以 及 他 们 对 未 来 的 科学 展望 。 与 这 些 科学 家 们 进行 的 这 些 访 谈 ， 向 读者 们 打 
开 了 为 一 忆 奇 妙 的 窗子 ， 其 形式 生动 活泼 、 妙 趣 横生 ， 和 希望 这 些 内 容 能 够 激励 读者 ， 尤 其 是 年 
轻 的 读者 ， 走 上 一 条 成 功 的 道路 。 

这 是 一 本 适用 面 很 广 的 书 ， 既 可 用 作 大 学 程序 设计 语言 课程 的 教材 ， 也 可 用 作 自 学 语言 的 
读物 ， 毕 业 多 年 的 经 验 丰 富 的 计算 机 工作 者 也 可 以 读 一 读 来 更 新 知识 。 


译 者 
2008 年 3 月 
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第 8 版 的 变化 


本 书 的 目的 、 总 体 结构 以 及 写作 方式 与 前 面 的 7 个 版 本 保持 了 一 致 。 其 主要 目的 是 介绍 当代 
程序 设计 语言 的 主要 结构 ， 并 为 读者 提供 对 已 有 的 程序 设计 语言 和 未 来 的 程序 设计 语言 进行 客 
观 评 们 所 必需 的 工具 ， 还 有 一 个 目的 是 通过 提供 对 程序 设计 语言 的 深入 讨论 ， 以 及 通过 表述 一 
种 描述 语法 的 形式 化 方法 ， 为 读者 学 习 编译 器 的 设计 做 准备 。 

本 书 是 在 第 7 版 的 基础 加 诸 两 种 改变 演化 而 来 的 。 首 先 ， 本 书 采 用 一 些 较 新 语言 的 素材 取代 
了 较 老 的 程序 设计 语言 内 容 ， 从 而 保持 内 容 上 的 新 颖 。 有 关 Python 和 Ruby 独 特 的 控制 结构 的 讨 
论 加 入 到 第 8 章 。 第 9 章 中 将 涵盖 Ruby 块 和 返 代 。 在 Python 和 Ruby 中 对 抽象 数据 类 型 支持 以 及 在 
Java 5.0 和 C# 2005 中 对 泛 型 类 支持 的 讨论 放 在 第 11 章 。 第 12 章 加 入 了 支持 面 对 对 象 程序 设计 
(OOP) 的 Ruby 语 言 的 概述 。 其 次 ， 为 了 增强 本 书 表述 的 清晰 程度 ， 书 中 的 大 部 分 章节 都 进行 
了 细微 的 修正 。 


全 书 概貌 


本 书 通过 讨论 各 种 语言 结构 的 设计 问题 ， 讨 论 最 常用 语言 中 这 些 结构 的 设计 选择 ， 并 客观 
比较 各 种 设计 选择 ， 来 描述 程序 设计 语言 的 基本 概念 。 

要 对 程序 设计 语言 进行 认真 研究 ， 需 要 讨论 以 下 相关 课题 ， 其 中 包括 描述 程序 设计 语言 也 
语法 和 语义 的 形式 方法 , 该 课题 被 概括 进 本 书 的 第 3 章 。 本 书 还 考虑 了 各 种 语言 结构 的 实现 技术 : 
第 4 章 讨论 词法 分 析 和 语法 分 析 , 第 10 章 讨论 子 程序 链接 的 实现 。 其 他 一 些 语言 结构 的 实现 问题 ， 
也 在 本 书 的 各 个 不 同 部 分 进行 讨论 。 

下 面 简略 说 明 第 8 版 包括 的 内 容 。 


章 六 概述 


第 1 章 从 学 习 程序 设计 语言 的 目的 开始 ， 讨 论 用 于 评估 程序 设计 语言 及 语言 结构 的 标准 ， 以 
及 影响 语言 设计 的 主要 因素 ， 设 计 中 常用 到 的 权衡 方法 及 其 基本 的 实现 方法 。 

第 2 革 概 述 书 中 讨论 的 大 部 分 重要 语言 的 演化 过 程 。 虽 然 没有 完整 地 描述 某 一 种 语言 ， 但 对 于 每 
一 种 语言 的 起 源 、 目 的 和 它 的 贡献 都 进行 了 分 析 。 这 种 历史 回顾 十 分 有 价值 : 它 为 人 们 理解 当代 语言 
设计 的 实践 和 理论 基础 提供 了 必要 的 背景 ， 也 为 进一步 学 习 语 言 的 设计 以 及 评估 提供 了 动力 。 除 此 之 
外 ， 因 为 书 中 的 其 他 章节 都 不 依赖 第 2 章 ， 因 而 可 以 将 这 一 章 作为 完全 独立 的 部 分 来 阅读 。 

第 3 章 讨论 描述 程序 设计 语言 语法 的 主要 形式 方法 ， 即 巴 科斯 -诺尔 范式 (BNF)。 接 着 是 
天 于 属性 文法 的 描述 ， 该 文法 描述 了 语言 的 静态 语义 及 语法 。 然 后 讲解 语义 描述 这 一 有 难度 的 
主题 ， 这 里 包括 对 三 种 最 常用 语义 描述 方法 的 简略 介绍 ， 即 操作 语义 、 公 理 语义 和 指称 语义 。 

第 4 章 介 绍 词法 分 析 和 语法 分 析 。 这 一 章 是 为 那些 没有 设置 编译 器 设计 课程 的 学 校准 备 的 。 
与 第 2 章 相 似 ， 这 一 章 也 是 独立 的 ， 可 以 不 依赖 书 中 的 其 他 章节 独立 学 习 。 

第 5 章 到 第 14 章 详细 地 描述 命令 式 语言 主要 结构 的 设计 问题 。 对 其 中 每 一 种 结构 ， 作 者 列举 
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AIPA SLAC Pla Sie, AYE, PSR MIF RMS h, Eaa ERER, 
而 第 7 章 则 解释 表达 式 及 赋值 语句 ， 第 8 章 描述 控制 语句 ， 第 9 章 和 第 10 章 讨论 子 程序 及 其 实现 问 
题 ， 第 11 章 研究 数据 抽象 的 机 制 ， 第 12 章 提供 了 关于 支持 面向 对 象 程 序 设计 语言 特征 (继承 和 动 
态 方法 绑 定 ) 的 深入 讨论 ， 第 13 章 讨论 并 发 程序 单元 ， 第 14 章 介绍 异常 处 理 以 及 事件 处 理 。 

最 后 两 章 (第 15 章 和 第 16 章 ) 描述 两 种 最 重要 的 、 不 同 的 程序 设计 范 型 函数 式 程序 设计 及 
逻辑 程序 设计 。 第 15 章 介绍 Scheme 语 言 ， 包 括 它 的 一 些 基本 功能 、 特 殊 形式 、 函 数 形式 ， 并 给 出 
用 Scheme 语言 编写 的 简单 函数 示例 。 接 下 来 ， 简 略 地 介绍 ML 和 Haskell 语 言 ， 以 说 明 不 同形 式 的 
国 数 式 语 言 。 第 16 章 介绍 逻辑 程序 设计 以 及 逻辑 程序 设计 语言 ，Prolog。 


写 给 教师 


在 位 于 科罗拉多 州 斯 普 林 的 科罗拉多 大 学 的 初级 程序 设计 语言 课堂 上 ， 我 们 是 这 样 来 使 用 本 
BAY: 我 们 通常 会 详细 地 讲授 第 1 章 与 第 3 章 。 由 于 第 2 章 没有 很 难 的 技术 内 容 ， 我 们 只 花费 很 少 的 
课时 来 讲解 ， 而 且 如 我 们 在 前 面 提 到 的 ， 后 面 所 有 章节 的 内 容 都 不 依赖 于 第 2 章 ， 所 以 这 一 章 的 内 
容 完全 可 以 自学 完成 。 此 外 ， 我 们 单独 设置 编译 器 设计 课程 ， 所 以 第 4 章 也 不 在 本 课程 里 讲授 。 

对 于 具有 丰富 的 C++、Java 和 C# 语 言 程序 设计 经 验 的 学 生 ， 第 5 章 到 第 9 章 是 相对 容易 的 。 
第 10 章 到 第 14 章 则 有 些 挑战 性 ， 因 而 需要 进行 比较 详细 地 讲授 。 | 

对 大 多 数 的 低 年 级 学 生 而 言 ， 第 15 章 和 第 16 章 是 全 新 的 。 理 想 情况 下 ， 应 该 对 那些 学 习 这 
两 章 内 容 的 学 生 提供 Scheme 和 Prolog 的 语言 处 理 器 。 书 中 提供 了 充足 的 资料 ， 指 导 学 生 写 出 
简单 的 程序 。 

本 科 生 的 课程 中 可 以 不 讲解 最 后 两 章 的 全 部 内 容 ， 但 在 研究 生 的 课程 中 则 可 以 讨论 这 两 章 
的 所 有 内 容 ， 此 时 可 以 跳 过 前 面 几 章 关于 命令 式 语言 的 内 容 。 


教 辅 资料 


本 书 的 所 有 读者 都 可 以 从 网 址 www.aw.com/cssupport 得 到 下 列 的 教 辅 资料 ， 
“一 僚 教 学 幻灯 片 ， 本 书 每 一 章 都 能 获取 到 相应 的 PowerPoint* 幻 灯 片 ，。 
e PowerPoint 幻灯 片 包含 有 本 书 所 有 的 图 片 。 
为 了 便于 增强 课堂 教学 的 效果 、 配 合 课程 中 动手 实验 、 帮 助 远程 教学 中 学 习 的 学 生 ， 我 们 
在 网 站 www.aw.com/sebesta 放 置 了 以 下 资源 与 大 家 共享; 
“提供 几 种 语言 的 小 型 学 习 手 册 (大 约 100 页 的 辅导 材料 )。 我 们 希望 借助 这 套 手册 ， 给 予 学 生 足 
够 的 信息 来 完成 书 中 章节 里 有 关 各 种 语言 的 练习 ,使 学 生 们 知道 如 何在 其 他 的 语言 中 编写 程序 ， 
在 作者 提供 的 相关 网 站 上 包括 C++、C、Java 以 及 Smalltalk 语言 的 手册 。 
“实行 目 我 评分 。 学 生 们 可 以 通过 完成 多 项 选择 以 及 填空 练习 来 检测 自己 对 于 学 完 音 节 的 
理解 程度 。 
在 此 声明 : 练习 题 的 答案 只 提供 给 教师 (位 于 www.aw-bc.coryirc 的 教师 资源 中 心 ) 。 请 
采用 本 书 作为 教材 的 教师 按 书 后 的 教学 支持 说 明 表 中 提供 的 联系 方式 联络 Addison-Wesley 公 
司 北京 办 事 处 索取 相关 教 辅 资料 或 发 送 E-mail (computing@aw.com 以 获取 更 多 的 信息 )， 


可 用 的 语言 处 理 器 


书 中 讨论 的 一 些 程序 设计 语言 的 处 理 器 ， 以 及 一 些 关 于 程序 设计 语言 的 信息 ， 能 够 通过 下 
列 网 址 获得 : 


C、C++、Fortran 和 Ada gcc.gnu.org 


C# microsoft.com 

Java java.sun.com 

Haskell haskell.org 

Scheme www.plt-scheme.org/software/drscheme 
Perl www.perl.com 

Python www.python.org 

Ruby www .ruby-lang.org/en/ 


实际 上 ， 几 乎 所 有 浏览 器 都 包含 了 Java Script, 几乎 所 有 Web 服 务 器 都 包含 了 PHP。 相 关 网 
站 也 包含 了 这 些 信 息 。 
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第 1 章 BARE 


我 们 在 深入 学 习 程 序 设计 语言 原理 之 前 ， 需 要 考虑 几 个 基本 的 概念 。 首 先 我 们 将 讲解 ， 为 
什么 计算 机 科学 专业 的 学 生 以 及 专业 软件 开发 人 员 需 要 学 习 语 言 的 设计 和 评估 的 一 般 原理 。 这 
种 讨论 对 于 那些 认为 只 要 有 一 、 两 种 程序 设计 语言 的 工作 经 验 就 足够 了 的 计算 机 科学 人 员 来 说 ， 
是 十 分 有 价值 的 。 接 下 来 ， 我 们 将 简略 描述 程序 设计 的 主要 范畴 。 然 后 ， 由 于 本 书 将 评价 各 种 
程序 设计 语言 的 构成 和 特性 ， 我 们 将 会 列 出 用 于 判别 程序 设计 语言 优 劣 的 标准 。 紧 接着 ， 我 们 
将 讨论 两 个 影响 程序 设计 语言 的 重要 因素 ， 即 计算 机 体系 结构 以 及 程序 设计 方法 学 。 之 后 ， 我 
们 将 给 出 程序 设计 语言 的 不 同 分 类 。 再 接着 ， 我 们 将 阐述 在 语言 设计 中 必须 考虑 的 几 种 主要 权 
衡 取舍 方法 。 

由 于 本 书 也 叙述 程序 设计 语言 的 实现 ， 因 而 我 们 在 这 一 章 中 概括 了 最 常用 的 程序 设计 语言 
实现 的 方法 。 最 后 ， 我 们 将 简略 地 描述 几 个 程序 设计 环境 的 例子 并 且 讨 论 这 些 环 境 因素 对 于 软 
件 产品 的 影响 。 


1.1 学 习 程 序 设计 语言 原理 的 缘由 


学 生 们 会 很 自然 地 间 ， 他 们 如 何 能 够 从 程序 设计 语言 原理 的 学 习 中 得 益 。 毕 葛 在 计算 机 科 
学 领域 里 ， 还 有 其 他 大 量 的 题材 值得 花费 时 间 认 真 学 习 。 下 面 ， 是 我 们 认为 计算 机 科学 人 员 通 
过 学 习 程 序 设计 语言 原理 能 够 获得 的 种 种 益处 。 

。 增 进 表 达 思 想 的 能 力 。 人 们 普遍 认为 ， 我 们 思维 的 深度 受 我 们 用 来 进行 思想 交流 的 语言 

以 及 这 种 语言 的 表达 能 力 的 影响 。 对 自然 语言 而 言 ， 那 些 只 掌握 有 限 语言 的 人 ， 甚 思维 

的 复杂 程度 ， 特 别 是 其 抽象 思维 的 深度 ， 必 然 受 到 局 限 。 换 言 之 ， 人 们 对 不 能 口头 或 笔 

头 描 述 的 事物 结构 必定 很 难 将 其 概念 化 。 

程序 员 在 开发 软件 的 过 程 中 也 同样 受制 于 这 个 法 则 ， 用 来 开发 软件 的 程序 设计 语言 制约 着 
程序 员 能 够 应 用 的 控制 结构 、 数 据 结构 和 数据 抽象 的 类 型 ， 因 而 也 制约 着 他 们 所 能 够 设计 的 算 
法 。 了 解 多 种 程序 设计 语言 的 特性 ， 能 够 使 程序 员 在 软件 开发 的 过 程 中 减少 这 种 受 限 性 。 程 序 
员 可 以 通过 学 习 新 的 程序 设计 语言 的 结构 来 拓宽 软件 开发 的 思路 。 

有 人 或 许 会 提出 不 同意 见 ， 学 习 其 他 程序 设计 语言 所 具备 的 功能 ， 并 不 能 帮助 一 个 正 用 有 对 
种 不 具备 这 些 功能 的 程序 设计 语言 工作 的 编程 人 员 。 然 而 ， 这 种 论点 事实 上 不 成 立 。 因 为 一 些 
程序 设计 语言 的 结构 ， 常 常 可 以 使 用 其 他 不 直接 支持 这 些 结构 的 语言 来 构造 。 例 如 ， 一 个 学 会 
了 Perl (Wall et al., 2000) 语言 中 关联 数组 结构 及 使 用 的 C 程 序 员 ， 就 可 能 用 C 设计 出 模拟 关联 
数组 的 结构 来 。 换 名 话说， 学 习 程 序 设计 语言 的 原理 ， 将 培养 评价 语言 特性 的 能 力 ， 并 将 鼓励 
程序 人 员 运 用 这 些 语言 特性 。 

。 增 强 选 择 适 用 语言 的 能 力 。 许 多 专业 软件 开发 人 员 只 受过 有 限 的 正规 计算 机 科学 教育 ， 

往往 是 通过 自学 ， 或 者 通过 公司 或 单位 的 培训 课程 。 这 样 的 培训 往往 只 教会 他 们 一 种 或 

者 是 两 种 与 当前 工作 项 目 直接 相关 的 语言 。 另 外 的 许多 程序 人 员 是 在 很 早 以 前 受过 正规 

的 训练 。 他 们 当时 学 习 的 语言 已 经 不 再 使 用 ， 而 许多 当今 在 程序 设计 语言 中 已 经 广泛 使 

用 的 特性 那 时 还 没有 出 现 。 这 样 就 导致 许多 程序 员 当 需要 为 新 的 项 目 选择 程序 设计 语言 


时 ， 他 们 宁可 继续 使 用 自己 最 为 熟悉 的 那 种 语言 ， 尽 管 这 种 语言 已 经 很 不 适宜 于 新 的 项 

目 。 如 霖 这 些 程序 员 熟 悉 许 多 种 语言 和 语言 结构 ， 他 们 便 能 够 针对 实际 问题 更 好 地 选择 

更 适当 的 语言 。 

证 多 的 语言 特性 可 以 在 其 他 不 具备 这 些 特性 的 语言 中 构造 出 来 的 事实 ， 丝 毫 不 能 削弱 设计 
具有 一 系列 最 佳 特性 语言 的 重要 性 。 一 种 已 经 嵌入 某 种 语言 的 特性 ， 总 是 优 于 对 该 特性 的 仿制 ， 
仿制 的 特性 往往 不 够 优雅 、 方 便 ， 而 且 在 一 种 并 不 支持 该 特性 的 语言 中 也 不 够 安全 ， 

“增强 学 习 新 语言 的 能 力 。 计 算 机 程序 设计 仍旧 是 一 个 相对 年 轻 的 学 科 ， 其 设计 方法 学 、 

软件 开发 工具 ， 以 及 程序 设计 语言 ， 都 还 处 于 不 断 演变 的 状态 之 中 。 这 使 得 软件 开发 成 

为 一 种 激动 人 心 的 专业 ， 但 这 同时 也 意味 着 不 断 学 习 成 为 关键 所 在 。 学 习 一 种 新 的 程序 

设计 语言 可 能 是 一 个 漫长 而 艰难 的 过 程 。 这 对 于 那些 只 习惯 于 一 种 或 者 两 种 语言 ， 并 且 

从 未 认真 钻研 过 程序 设计 语言 基本 原理 的 人 来 说 尤其 如 此 。 一 旦 透彻 地 掌握 了 程序 设计 

语言 的 基本 概念 ， 就 不 难 理解 这 些 基本 原理 是 如 何 地 融入 我 们 所 学 习 的 语言 的 设计 之 中 、 

例如 ， 理 解 面 向 对 象 程序 设计 原理 的 程序 人 员 ， 较 之 从 未 运用 这 些 原理 的 程序 人 员 ， 能 

够 更 为 轻松 地 学 习 Java 语言 (Arnold et al., 2000), 

人 和 人们 在 使 用 自然 语言 的 时 候 也 会 发 生 同 样 的 现象 。 你 对 母语 的 语法 理解 得 越 好 ， 你 会 发 现 
学 习 第 二 种 语言 越 容易 。 更 为 其 之 ， 学 习 第 二 种 语言 还 能 够 帮助 你 更 好 地 理解 母语 

TIOBE 程 序 设 计 社 区 发 布 了 一 个 指示 程序 设计 语言 相对 流行 程度 的 排行 榜 (http://www. 
tiobe.com/tiobe_index/index.htm)。 例 如 ， 在 2007 年 1 月 的 排行 榜 上 ， Java、C 和 C++ 是 三 种 最 常 
使 用 的 语言 。 然 而 ， 数 十 种 其 他 语言 同时 也 应 用 得 相当 广泛 。 排 行 榜 数据 也 说 明了 程序 设计 语 
言 使 用 的 分 布 情况 总 是 在 改变 。 正 在 使 用 的 语言 列表 的 长 度 和 统计 的 动态 变化 暗示 了 每 个 软件 
开发 人 员 必 须 频繁 地 学 习 不 同 的 语言 。 

最 后 ， 对 于 进行 实际 工作 的 程序 设计 人 员 来 说 ， 关 键 是 通晓 程序 设计 语言 的 术语 以 及 基本 
概念 。 这 样 ， 就 能 阅读 和 理解 程序 设计 语言 手册 ， 以 及 语言 和 编译 器 的 说 明 书 和 其 他 文件 。 它 
们 是 选择 和 学 习 一 门 语言 的 信息 源 。 

“更 好 地 理解 实现 的 重要 性 。 在 学 习 程 序 设计 语言 原理 时 ， 影 响 这 些 原理 的 实现 方法 是 十 

分 有 趣 也 是 十 分 必要 的 课题 。 常 常 ， 人 们 对 程序 设计 语言 实现 方法 的 理解 ， 会 使 得 他 们 

容易 理解 一 种 语言 为 什么 要 这 样 设计 。 而 这 种 理解 能 够 进一步 催生 更 加 明知 地、 按照 设 

计 目 的 来 运用 语言 的 能 力 。 通 过 理解 程序 设计 语言 组 成 结构 的 种 种 选择 ， 并 且 明 了 这 些 

选择 所 拥有 的 结果 ， 我 们 就 能 成 长 为 更 加 优秀 的 程序 设计 人 员 ， 

往往 只 有 懂得 有 关 的 程序 设计 语言 实现 细节 的 程序 员 才 可 能 发 现 和 改正 某 些 类 型 的 程序 错 
菊 。 理 解 语言 实现 问题 的 另 一 个 好 处 是 ， 它 会 使 我 们 明了 计算 机 是 怎样 执行 各 种 程序 设计 语言 
结构 的 。 在 某 些 情况 下 ， 有 关 实现 问题 的 知识 能 够 为 选择 相对 高 效 的 一 种 结构 编写 程序 提供 线 
守 。 例 如 ， 不 懂得 递归 调用 是 如 何 实现 的 程序 员 ， 常 常 不 知道 递归 算法 比 等 价 的 迭代 算法 要 慢 
得 多 。 

因为 本 书 只 教授 一 些 实现 问题 的 知识 ， 所 以 上 述 两 段 内 容 也 适用 于 对 学 习 编 译 器 设计 的 解释 

“更 好 地 使 用 已 知 的 语言 。 当 代 许 多 语言 都 是 庞大 的 和 复杂 的 ， 因 此 程序 员 熟 悉 和 使 用 所 

米 用 语言 的 所 有 特性 是 很 少见 的 。 通 过 学 习 程 序 设计 语言 原理 ， 程 序 员 能 够 学 习 到 他 们 

己 采 用 语言 的 以 前 未 知 和 未 使 用 的 部 分 特性 ， 然 后 开始 使 用 那些 特性 ， 

"“ 促进 整个 计算 科学 的 发 展 。 最 后 ， 从 计算 科学 的 整体 上 来 看 ， 可 以 证 明 学 习 程序 设计 语 

言 原 理 的 必要 性 。 虽 然 我 们 通常 可 以 确定 某 种 程序 设计 语言 得 以 广泛 应 用 的 原因 ， 但 许 

多 人 在 回顾 中 都 认为 ， 最 广泛 流行 的 语言 在 当时 并 不 总 是 最 好 的 语言 。 在 某 些 情况 下 _- 
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种 语言 被 广泛 使 用 ， 部 分 原因 是 由 于 选择 语言 的 决策 人 员 对 程序 设计 语言 的 一 般 原理 不 

例如 ， 许 多 人 认为 ，20 世 纪 60 年 代 初 期 ， 如 果 ALGOL 60 (Backus et al., 1962) 取代 了 
Fortran (INCITS/ISO/IEC, 1997) 的 话 ， 情 形 会 好 得 多 ， 因 为 ALGOL 60 语 言 更 优雅 ， 它 的 控制 语 
句 也 比 Fortran 的 好 得 多 。 之 所 以 没 能 如 此 ， 是 由 于 当时 许多 程序 员 以 及 软件 开发 的 管理 人 员 没 
有 清晰 理解 ALGOL 60 的 设计 原理 。 他 们 感觉 ALGOL 60 的 说 明 书 太 难 读 (的 确 如 此 )， 又 更 难 
懂 。 他 们 不 能 够 欣赏 它 的 模块 结构 、 递 归结 构 以 及 出 色 的 控制 语句 ， 因而 不 能 体会 到 ALGOL 
60 超越 Fortran 的 好 处 。 

当然 ， 如 我 们 将 在 第 2 章 里 介绍 的 ， 还 有 其 他 许多 的 原因 也 使 得 ALGOL 60 没 能 为 人 们 所 
接受 。 然 而 可 以 肯定 的 是 ， 当 时 的 开发 人 员 没有 领悟 到 这 种 语言 的 种 种 优点 ， 这 起 了 决定 性 
的 作用 。 

一 般 而 言 ， 如 果 选 择 语 言 的 决策 人 员 具 有 全 面 的 知识 ， 会 选择 好 的 语言 取代 差 的 语言 。 


1.2 程序 设计 应 用 领域 


今天 计算 机 已 经 大 量 地 应 用 于 现代 社会 的 各 个 领域 ， 从 控制 核能 发 电厂 到 提供 移动 电话 中 
的 电子 游戏 。 由 于 计算 机 应 用 领域 的 千差万别 ， 人 们 开发 了 用 于 不 同 目的 的 程序 设计 语言 。 在 
这 一 慷 中 ， 我 们 将 简略 地 讨论 几 个 计算 机 应 用 领域 ， 以 及 与 其 相关 的 程序 设计 语言 。 


1.2.1 科学 应 用 


“0 世纪 40 年 代 出 现 的 第 一 台数 字 计算 机 曾经 用 于 科学 应 用 ， 并 且 事 实 上 是 为 科学 应 用 而 发 
明 的 。 科 学 计算 的 特点 是 ， 数 据 结构 简单 ， 但 具有 大 量 浮 点 数 的 算术 运算 。 其 中 最 常用 的 数据 
质 构 是 数组 和 和 矩阵， 而 最 常用 的 控制 结构 是 计数 循环 和 选择 。 早 期 为 科学 计算 而 发 明 的 高 级 话 
言 就 征 为 了 满足 这 种 需要 而 设计 的 。 那 个 时 候 高 级 语言 的 对 手 是 汇编 语言 ， 因 而 高 效率 是 其 设 
计 的 基本 要 点 。 第 一 种 科学 应 用 语言 是 Fortran。ALGOL 60 及 其 绝 大 多 数 的 后 代 语言 ， 尽 管 也 
征 为 其 他 相关 的 用 途 而 设计 的 ， 但 主要 是 以 科学 计算 为 主要 目的 。 对 于 一 些 以 计算 效率 为 基本 
要 扩 的 科学 应 用 而 言 ， 如 在 20 世 纪 50 年 代 和 60 年 代 较为 普遍 的 那些 科学 应 用 ， 后 来 的 程序 设计 
语言 没有 哪 一 种 在 效率 方面 明显 优 于 Fortran。 


1.2.2 商务 应 用 


计算 机 在 商务 上 的 应 用 始 于 20 世 纪 50 年 代 。 人 们 为 此 开发 了 专门 用 途 的 计算 机 ， 随 之 以 特 
定 的 程序 设计 语言 。 第 一 种 成 功 的 高 级 商务 语言 是 初版 出 现 于 1960 年 的 COBOL (ISO/IEC, 
2002)。 至 今 这 种 语言 仍然 是 这 一 应 用 中 最 为 广泛 使 用 的 程序 设计 语言 。 商 务 语言 的 特征 有 ， 大 
助 产生 详尽 报表 的 机 制 ， 能 以 精确 的 方式 描述 与 存储 十 进 制 数 以 及 字符 数据 ， 以 及 能 够 进行 十 
进 制 算术 运算 的 能 力 。 

商务 应 用 语言 中 ， 除 了 COBOL 的 发 展 与 演化 以 外 ， 其 他 开发 十 分 有 限 。 因而 本 书 仅仅 包括 
了 对 于 COBOL 语 言 结构 的 有 限 讨论 。 


1.2.3 人 工 智能 


ALERE (AD 是 计算 机 应 用 的 一 个 广泛 领域 ， 它 的 特征 是 使 用 符号 运算 而 非 数值 运算 ， 符 
号 运 蜡 指 的 是 ， 我 们 处 理 的 是 由 名 字 而 非 数字 组 成 的 符号 。 对 于 符号 运算 ， 采 用 数据 链表 结构 比 
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用 数组 结构 更 为 方便 。 这 种 类 型 的 程序 设计 ， 有 时 需要 比 其 他 程序 设计 领域 拥有 更 大 的 灵活 性 。 
例如 在 一 些 人 工 智能 的 应 用 中 ， 能 够 在 程序 运行 的 过 程 中 创立 并 执行 程序 段 的 能 力 将 带 来 方便 。 

第 一 种 为 人 工 智能 应 用 而 开发 并 被 广泛 运用 的 程序 设计 语言 是 产生 于 1959 年 的 函数 式 语言 
LISP (McCarthy et al.，1965) 。 大 多 数 1990 年 以 前 的 人 工 智能 应 用 程序 ， 都 是 用 LISP 语言 或 者 
与 其 相近 的 一 种 程序 设计 语言 编写 的 。 然 而 在 20 世 纪 70 年 代 的 初期 ， 出 现 了 实施 于 一 些 人 工 智 
能 应 用 的 另外 一 种 方法 ， 即 使 用 Prolog (Clocksin and Mellish, 2003) 语言 的 逻辑 程序 设计 。 更 
后 来 ， 人 们 使 用 诸如 C 语 言 之 类 的 科学 语言 来 编写 一 些 人 工 智 能 的 应 用 。 本 书 将 于 第 15 章 和 第 
16 章 分 别 介 绍 LISP 的 一 种 方言 Scheme (Dybbig, 2003) 以 及 Prolog 语 言 。 


1.2.4 系统 程序 设计 


计算 机 系统 的 操作 系统 ， 以 及 所 有 在 计算 机 系统 中 支持 程序 设计 的 工具 ， 被 统称 为 系统 软 
件 。 系 统 软件 几乎 总 在 运行 着 ， 因 此 必须 要 有 很 高 的 执行 效率 。 因 而 ， 用 于 这 个 领域 的 语言 必 
须 提供 快速 执行 的 能 力 。 更 进一步 讲 ， 这 种 语言 必须 要 有 低层 次 的 语言 特性 ， 这 样 才能 编写 连 
接 外 部 设备 的 软件 界面 。 

在 20 世 纪 60 年 代 与 70 年 代 ， 一 些 计算 机 制造 三 商 ， 如 IBM、Digital 和 Burroughs (现在 的 
UNISYS) ， 为 他 们 自己 机 器 上 的 系统 软件 开发 了 专用 的 面向 机 磊 的 高 级 语言 。 用 于 IBM 大 型 机 
的 语言 是 PL/S， 它 是 PL/I 的 一 种 方言 ， 用 于 Digital 机 器 的 语言 是 BLISS， 它 是 一 种 仅仅 高 于 汇 
编 语言 的 程序 设计 语言 ， 用 于 Burroughs 机 喜 的 语言 是 一 种 扩展 的 ALGOL 语 言 。 

UNIX 操 作 系 统 几乎 全 部 是 用 C (ISO, 1999) 来 编写 的 ， 这 使 得 UNIX 系 统 很 容易 移植 到 不 
同 的 机 器 上 。C 的 一 些 特 征 使 得 它 非常 适合 于 系统 程序 设计 : 它 是 低级 语言 ， 它 有 很 高 的 执行 
效率 ， 而 且 它 没有 给 用 户 增 加 许多 安全 限制 的 额外 负担 。 系 统 程序 员 往 往 是 优秀 的 程序 人 员 ， 
他 们 常 弟 认为 不 需要 这 种 限制 。 然 而 也 有 一 些 非 系统 程序 员 认 为 ， 用 C 来 编写 大 规模 的 、 重 要 
性 程度 高 的 系统 软件 危险 性 太 大 。 


1.2.5 万 维 网 语言 


世界 万 维 网 是 由 一 系列 兼容 语言 来 支持 的 ， 包 括 从 并 不 是 程序 设计 语言 的 标志 语言 ， 如 
XHTML， 到 通用 目的 的 程序 设计 语言 ， 如 Java。 由 于 对 于 动态 万 维 网 内 容 的 普遍 需要 ， 一 些 
计算 功能 常常 被 包括 进 表 示 内 容 的 技术 之 中 。 这 种 技术 可 以 通过 将 程序 设计 代码 谋 入 XHTML 
文件 来 实现 。 被 符 入 的 代码 通常 是 一 种 脚本 语言 ， 如 JavaScript， 或 者 PHP。 反 过 来 ，XHTML 
文件 也 可 以 要 求 运行 万 维 网 服务 器 上 的 一 个 单独 程序 来 提供 动态 内 容 ， 而 这 种 服务 器 上 的 程序 
则 完全 可 以 使 用 任何 程序 设计 语言 来 编写 。 也 有 一 些 类 似 标志 语言 的 语言 ， 这 些 被 扩展 的 语言 
包括 了 一 些 控制 文档 处 理 的 结构 。 关 于 这 些 ， 我 们 将 在 1.5 节 和 第 2 章 中 进行 讨论 。 

1.3 语言 评估 标准 

如 前 所 述 ， 本 书 的 目的 是 详细 探讨 程序 设计 语言 中 各 种 结构 及 功能 中 所 包含 的 基本 原理 。 
我 们 也 要 评价 语言 特性 ， 尤 其 要 将 注意 力 集中 于 这 些 特性 对 于 软件 的 开发 过 程 (也 包括 软件 
的 维护 过 程 ) 的 影响 。 要 做 到 这 一 点 ， 需 要 有 一 系列 的 评估 标准 。 但 这 样 的 一 系列 标准 必定 
有 争议， 任何 两 位 计算 机 科学 家 对 某 些 给 定语 言 特性 的 价值 都 不 可 能 完全 达成 一 致 。 尽 管 具 
有 如 此 大 的 争议 ,但 是 绝 大 部 分 计算 机 科学 工作 者 赞同 下 面 小 节 所 讨论 的 这 些 标准 的 确 是 重 
要 的 。 

表 1-1 中 列举 了 影响 4 种 最 重要 标准 中 的 3 种 的 语言 特性 ， 而 关于 这 些 标准 的 本 身 ， 将 在 接 下 
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来 的 几 个 小 节 里 进行 讨论 。9 注 意 ， 只 有 最 重要 的 特性 在 表 中 列 出 来 了 ， 并 在 随后 的 小 市 中 将 
对 其 进行 讨论 。 根 据 个 人 判断 ， 也 能 决定 特性 的 重要 性 ， 实 际 上 ， 所 有 表 中 位 置 都 能 用 * 填 充 。 
注意 这 里 的 一 些 标 准 ， 如 可 读 性 ， 其 范围 广泛 并 具有 一 定 程度 的 模糊 性 。 而 另外 的 一 些 则 
是 特定 的 语言 结构 ， 如 异常 处 理 。 尽 管 在 这 里 的 讨论 可 能 会 让 人 理解 为 所 有 的 这 些 标准 都 是 同 
等 重要 的 ， 但 这 并 不 是 我 们 的 初衷 ， 而 且 事 实 上 也 显然 并 非 如 此 。 
表 1-1 语言 的 评估 标准 和 影响 这 些 评估 标准 的 语言 特征 
Re 
可 读 性 可 写 性 可 靠 性 


mt 


语言 特性 
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控制 结构 
数据 类 型 与 数据 结构 
语法 设计 
支持 抽象 

表达 性 

类 型 检测 

异常 处 理 

别名 使 用 


* * * 六 * * * 


* * * * * ¥ * * * 5 


1.3.1 可 读 性 


判断 一 种 程序 设计 语言 优 儿 的 一 个 最 重要 的 标准 ， 是 用 它 所 编写 的 程序 好 读 、 好 懂 的 程度 。 
在 1970 年 之 前 ， 人 们 普遍 认为 软件 开发 就 是 编写 代码 。 当 时 考虑 程序 设计 语言 的 主要 特征 是 效 
率 与 机 器 的 可 读 性 。 而 语言 中 结构 的 设计 更 多 地 是 从 机 器 的 角度 ， 而 较 少 考虑 计算 机 用 户 的 因 
素 。 然 而 目 20 世 纪 70 年 代 提出 了 软件 生命 周期 概念 (Booch, 1987), 以 后 ， 编 程 降格 为 较为 次 
要 的 角色 ， 而 软件 维护 则 被 认为 是 软件 生命 周期 中 的 主要 部 分 ， 尤 其 是 从 成 本 的 角度 而 言 。 由 
于 软件 维护 的 难 易 在 很 大 程度 上 取决 于 程序 的 可 读 性 ， 所 以 可 读 性 就 成 了 衡量 程序 以 及 程序 设 
计 语 言 质量 的 重要 标志 。 这 曾 是 程序 设计 语言 发 展 中 的 一 个 重要 转折 点 ， 程 序 设计 语言 的 关注 
把 明 显 地 转移 ， 从 面 癌 机 右 转 癌 了 面向 人 类 (用 户 )。 

必须 将 可 读 性 放置 于 问题 领域 中 进行 考虑 。 例 如 ， 如 果 描 述 一 种 计算 问题 的 程序 是 用 某 种 
语言 编写 的 ， 而 这 种 语言 并 非 是 为 进行 这 种 类 型 的 计算 而 设计 的 ， 这 个 程序 可 能 就 会 不 自然 ， 
也 很 复杂 ， 因 而 就 会 特别 难 读 。 

下 面 我 们 将 会 阐述 影响 程序 设计 语言 的 可 读 性 的 特征 。 

1.3.1.1 整体 简单 性 

一 种 程序 设计 语言 的 整体 简单 性 极 大 地 影响 着 它 的 可 读 性 。 一 种 具有 大 量 基本 结构 的 语言 较 
只 有 少量 基本 结构 的 语言 要 难 学 得 多 。 当 程序 员 们 必须 使 用 一 种 “大 ” 的 语言 时 ， 他 们 往往 趋 
站 于 只 学 习 这 种 语言 的 一 部 分 内 容 ， 即 该 语言 的 一 个 子 集 ， 而 忽略 它 的 其 他 特性 。 人 们 的 这 种 学 
习 模 式 ， 有 时 成 了 语言 设计 者 们 将 大 量 的 语言 结构 堆 进 语言 的 借口 ， 然 而 这 是 不 正确 的 。 当 程序 
的 编写 者 学 会 的 语言 子 集 与 阅读 者 所 熟悉 的 语言 子 集 不 相同 时 ， 可 读 性 的 问题 就 出 现 了 。 

程序 设计 语言 的 第 二 种 复杂 特征 是 其 特性 的 多 样 化 ， 即 某 一 种 特定 的 操作 存在 着 多 种 实现 

O 第 四 个 重要 标准 是 代价 。 它 没有 在 表 中 列 出 ， 因 为 它 和 其 他 3 个 标准 关联 度 较 低 ， 并 且 与 影响 它们 的 特性 的 

关联 度 也 很 低 。 


方式 。 例 如 在 Java 中 ， 用 户 可 以 用 四 种 不 同方 法 来 实现 一 个 简单 整数 变量 的 增值 : 


count = count + 工 
count += 1 
count++ 

++count 


尽管 后 两 条 语句 之 间 , 以 及 后 两 条 语句 与 前 两 条 语句 之 间 , 在 某 些 情形 之 下 存在 些微 的 差异 ， 
但 当 作为 独立 表达 式 使 用 时 ， 这 四 条 语句 的 意义 都 是 一 样 的 。 我 们 将 在 第 7 章 中 讨论 这 些 差 异 。 

第 三 种 可 能 出 现 的 问题 是 运算 符 重 载 ， 即 单个 运算 符 被 赋予 多 种 运算 意义 。 虽 然 这 是 一 种 
有 用 的 特性 ， 但 是 如 果 我 们 允许 程序 的 编写 人 员 给 运算 符 赋予 他 们 自己 的 运算 意义 ， 而 他 们 又 
不 能 谨慎 所 为 的 话 ， 就 会 降低 程序 的 可 读 性 。 例 如 ， 人 们 显然 同意 将 加 法 运算 符 “+” 重 载 ， 
同时 来 做 整数 与 浮 点 数 的 加 法 。 事 实 上 这 样 的 运算 符 重 载 ， 通 过 减少 程序 设计 语言 中 运算 符 的 
数量 简化 了 语言 。 但 是 ， 假 设 某 编程 人 员 将 加 号 置 于 两 个 一 维 数组 的 操作 数 之 间 ， 并 定义 加 号 
的 意义 为 计算 这 两 个 一 维 数组 所 有 元 素 之 和 。 由 于 这 样 的 用 法 与 通常 的 矢量 加 法 完全 不 同 ， 无 
论 程 序 的 编写 者 还 是 阅读 者 都 会 对 上 述 加 法 程序 产生 不 解 。 另 一 个 更 为 极端 的 程序 混淆 示例 是 ， 
某 用 户 置 加 号 于 两 个 矢量 操作 数 之 间 ， 并 定义 该 加 号 的 意义 为 计算 这 两 列 矢量 相应 第 一 个 元 素 
之 兰 。 运 算 符 重 载 的 问题 还 将 在 第 7 章 里 作 进一步 讨论 。 

过 分 追求 语言 的 人 简单 性 也 不 妥 。 例 如 ， 下 一 节 就 要 讲 到 的 汇编 语言 ， 该 语言 中 多 数 语句 的 
形式 及 语义 都 是 简单 性 的 典范 。 然 而 ， 这 种 极端 的 简单 性 导致 了 汇编 语言 较 差 的 可 读 性 。 由 于 
入 编 语言 忌 乏 较为 复杂 的 控制 语句 ， 它 的 程序 结构 的 清晰 性 就 欠 佳 。 由 于 汇编 语言 的 语句 简单 ， 
编写 类 似 功 能 的 程序 时 ， 往 往 需 要 使 用 比 高 级 语言 多 得 多 的 语句 。 一 些 不 具备 足够 的 控制 结构 
及 数据 结构 的 高 级 语言 ， 也 会 具有 同样 的 问题 。 

1.3.1.2 正 交 性 

程序 设计 语言 的 正 交 性 指 的 是 ， 使 用 该 语言 中 一 组 相对 少量 的 基本 结构 ， 经 过 相对 少 的 结 
合 步骤 ， 可 以 构成 该 语言 的 控制 结构 与 数据 结构 。 而 且 ， 它 的 基本 结构 的 任何 组 合 都 是 合法 的 
和 有 意义 的 。 例 如 ， 我 们 来 考虑 数据 类 型 。 假 设 一 种 语言 具有 四 种 基本 数据 类 型 ( 即 整数 、 浮 
尽数 、 双 精度 数 和 字符 )， 它 还 具有 两 个 类 型 操作 符 ( 即 数组 和 指针 )， 如 果 这 两 个 类 型 操作 符 
能 够 作用 于 自身 以 及 这 四 种 基本 数据 类 型 ， 大量 的 数据 结构 就 能 够 由 此 而 被 定义 出 来 。 

正 交 语言 特性 的 意义 是 独立 于 它 在 程序 中 出 现 的 上 下 文 的 。( 正 交 这 个 名 词 来 自 于 正 交 向 量 
的 数学 概念 ， 正 交 向 量 是 相互 独立 的 。) 语言 的 正 交 性 来 自 于 它 的 基本 结构 的 对 称 关系 。 指 针 应 
该 能 够 指向 任何 类 型 的 变量 或 者 数据 结构 。 缺 乏 正 交 性 会 导致 语言 规则 的 异常 。 例 如 ， 如 果 不 
容许 指针 指向 数组 类 型 ， 许 多 可 能 性 就 被 消除 。 

下 面 ， 我 们 将 通过 比较 用 于 IBM 大 型 机 和 VAX 超 级 小 型 机 系列 的 汇编 语言 的 一 个 方面 ， 说 
明 作 为 语言 设计 的 原则 ， 应 该 如 何 使 用 正 交 性 。 让 我 们 考虑 一 种 简单 情形 ， 将 两 个 置 于 存储 器 
或 寄存 器 的 32 位 整数 数值 相 加 ， 并 用 相 加 之 和 来 替代 其 中 的 一 个 数值 。IBM 大 型 机 有 两 种 指令 
来 进行 这 种 运算 ， 它 们 的 形式 是 

A Regl, memory cell 

AR Regl, Reg2 

这 里 的 Reg1 和 Reg2 代 表 两 个 寄存 器 。 这 两 个 指令 的 语义 分 别 为 

Regl < contents(Regl) + contents (memory cell) 

Regl & contents (Regl) + contents (Reg2) 


而 两 个 32 位 整数 值 的 VAX 加 法 指令 为 


Bet 
> 
cy 
> 
本 


ADDL operand 1, operand 2 

该 指令 的 语义 为 

operand 2 ¢ contents(operand 1) + contents (operand 2) 

在 这 种 情形 中 ， 两 个 操作 数 (operand) 中 任何 一 个 都 可 以 是 寄存 器 或 者 存储 单元 。 

VAX 指 令 的 设计 是 正 交 的 ， 它 的 一 条 指令 可 以 将 寄存 器 或 者 存储 单元 作为 其 两 个 操作 数 。 
有 两 种 方式 可 以 来 说 明 这 两 个 操作 数 ， 而 且 它 们 能 以 任意 方式 组 合 。IBM 的 设计 不 是 正 交 的 。 
在 四 种 可 能 性 中 ， 只 有 其 中 两 种 操作 数 的 组 合 是 合法 的 ， 并 且 这 两 种 合法 组 合 需 要 两 条 不 同 的 
中 令 ， 即 A 和 RAR。IBM 的 设计 具有 更 多 的 限制 性 ， 所 以 它 的 可 写 性 较 差 。 例 如 ， 你 无 法 将 两 个 
数值 相 加 ， 并 将 其 和 存 到 一 个 存储 单元 上 去 。 进 而 ， 由 于 IJBM 的 设计 的 这 种 限制 ， 并 额外 需要 
一 条 指令 ， 因 而 较 难 掌握 。 

语言 的 正 交 性 与 语言 的 简单 性 是 紧密 相关 的 : 程序 设计 语言 的 正 交 性 设计 得 越 好 ， 该 语言 
规则 中 的 异 第 情况 就 会 越 少 。 较 少 的 异常 意味 着 设计 中 的 较 高 程度 的 规范 性 。 因 而 这 样 的 语言 
较 容 易 被 人 们 学 习 、 阅 读 和 理解 。 任 何 学 习 过 较 多 英语 的 人 ， 一 定 领 教 过 了 它 频繁 的 规则 异常 
〈 例 如，i 总 是 在 e 前 ， 除 非 在 c 后 ， 等 等 )。 

作为 高 级 语言 缺乏 正 交 性 的 例子 ， 我 们 考虑 C 语 言 中 下 面 的 一 些 规则 以 及 一 些 异 常 。 尽 管 C 
具有 数组 和 记录 (struct) 这 两 种 结构 化 的 数据 类 型 ， 然 而 记录 可 以 从 函数 中 返回 ， 而 数组 
则 不 能 。 一 种 结构 的 成 员 可 以 是 任意 数据 类 型 ， 但 不 能 是 void 或 者 是 同一 种 类 型 的 结构 。 一 
个 数组 的 元 素 可 以 是 任意 数据 类 型 ， 但 不 能 是 void 或 者 函数 。 参 数 是 按 值 传递 的 ， 但 数组 参 
数 却 是 按 地 址 传递 的 〈 因 为 在 C 程序 中 出 现 的 不 带 下 标的 数组 名 称 会 被 解释 为 该 数组 的 第 一 个 
元 素 的 地 址 )。 

作为 环境 依赖 性 的 一 个 例子 ， 考 虑 这 样 一 条 C 表 达 式 


a+b 


这 种 表达 式 通 常 意味 着 从 存储 空间 取出 a 和 b 的 数值 ， 并 将 它们 相 加 。 然 而 ， 如 果 a 碰 巧 是 
一 个 指针 ， 那 么 这 就 会 影响 到 b 的 数值 。 例 如 ， 如 果 a 指 向 一 个 有 四 个 字 节 长 的 浮 点 数值 ， 那 么 
b 的 数值 就 必须 在 与 a 相 加 之 前 先 被 扩大 一 一 在 这 里 是 被 4 相 乘 。 因 而 a 的 类 型 影响 到 对 b 数 值 的 
处 理 。b 所 在 的 环境 影响 着 它 本 身 的 意义 。 

过 分 地 仍 求 的 正 交 性 也 会 产生 问题 。 最 为 正 交 的 程序 语言 或 许 是 ALGOL 68 (van Wijng- 
aarden et al.，1969)。ALGOL 68 语 言 中 的 每 一 种 结构 都 具有 类 型 ， 并 且 这 些 类 型 都 不 存在 任 
何 限制 。 此 外 ， 绝 大 多 数 结构 都 产生 数值 。 这 种 结合 的 自由 导致 了 这 种 语言 的 极为 复杂 的 程 
序 结构 。 例 如 ， 条 件 语 句 可 以 与 变量 声明 或 其 他 语句 一 起 出 现在 赋值 语句 的 左面 ， 只 要 它 的 
结 来 古 一 个 地 址 。 这 种 极端 的 正 交 性 会 导致 不 必要 的 复杂 性 。 更 进一步 ， 由 于 此 类 语言 需要 
大 量 的 基本 结构 ， 高 度 的 正 交 性 导致 过 量 的 各 种 结合 ， 即 使 这 些 结合 都 是 简单 的 ， 它 们 绝对 
的 大 数量 也 会 导致 语言 的 复杂 性 。 

因而 语言 的 简单 性 至 少 部 分 是 归于 相对 少量 的 基本 结构 所 产生 的 结合 ， 以 及 限量 地 运用 正 

部 分 人 认为 ， 函 数 式 语言 是 简单 性 与 正 交 性 的 有 机 结合 。 函 数 式 语言 ， 如 LISP， 主 要 是 通 
过 将 函数 应 用 到 指定 参数 上 来 进行 运算 的 。 与 之 相反 ， 在 C、C++ 及 Java 这 类 命令 式 语言 中 ， 运 
算 通 第 以 变量 及 赋值 语句 为 特征 。 函 数 式 语言 提供 了 最 大 可 能 的 整体 简单 性 ， 因 为 它 能 使 用 单 
个 结构 即 函 数 的 调用 ) 来 完成 任何 运算 ， 而 多 个 函数 调用 又 能 以 简单 的 方式 相 结合 。 函 数 式 
语言 如 此 地 简单 漂亮 ， 这 就 是 为 什么 它 吸 引 了 一 些 程序 设计 语言 的 研究 人 员 ， 将 这 种 语言 作为 


首选 来 替代 复杂 的 非 函 数 式 语 言 ， 如 C++ 语言 。 然 而 其 他 的 因素 阻碍 了 函数 式 语 言 的 更 广泛 的 
应 用 ， 如 效率 等 。 

1.3.1.3 控制 语句 

20 世 纪 50 年 代 和 60 年 代 的 一 批 程序 设计 语言 由 于 缺乏 控制 语句 ， 导 致 了 很 差 的 可 读 性 。20 
世纪 70 年 代 针 对 这 种 缺陷 兴起 了 结构 化 程序 设计 的 变革 。 尤 其 是 人 们 已 经 普遍 地 意识 到 ， 滥 用 
goto 语 句 会 严重 地 降低 程序 的 可 读 性 。 能 够 从 头 顺 序 读 到 结尾 的 程序 ， 比 需要 读者 从 一 条 语句 
跳跃 到 另 一 条 语句 来 跟踪 程序 的 执行 顺序 要 好 读 得 多 。 例 如 下 面 用 C 编 写 的 岗 套 循环 : 

while (incr < 20) { 


while (sum <= 100) { 
sum += incr; 


} 


incr++; 
} 5 
如 有 果 C 如 同 Fortran 的 早期 版 本 一 样 ， 不 具有 这 种 while 语 句 ， 这 段 代码 将 会 写成 下 面 这 样 的 
形式 : 
loopl: 
if (incr >= 20) go to out; 
loop2: 
if (sum > 100) go to next; 
sum += incr; 
go to loop2; 
next: 
iner++3 
go to loopl; 
out: 


20 世 纪 70 年 代 初 期 BASIC 及 Fortran 的 版 本 缺乏 严格 限制 使 用 goto 语 名 的 控制 语句 ， 因 而 很 
难 用 它们 写 出 可 读 性 高 的 程序 。 然 而 自 20 世 纪 60 年 代 后 期 所 设计 的 大 多 数 程序 设计 语言 都 包括 
了 足够 的 控制 语句 ,这 极 大 地 减少 了 使 用 goto 语 句 的 必要 (如果 还 没有 完全 消除 它 的 使 用 的 话 )。 
所 以 现代 语言 中 的 控制 语句 的 设计 就 不 像 过 去 那样 对 可 读 性 有 很 大 的 影响 了 。 

当然 ， 使 用 任何 语言 都 有 可 能 编写 出 结构 性 能 差 的 程序 ， 而 在 一 种 语言 中 包括 goto 语 名 万 
其 容易 诱导 人 们 编写 这 类 差 的 程序 。 因 而 ， 语 言 中 适度 的 控制 语句 能 够 允许 人 们 编写 结构 优良 、 
可 读 性 高 的 程序 ， 但 仅仅 是 这 类 控制 语句 的 存在 并 不 能 保证 就 能 编写 出 可 读 的 程序 来 。 

1.3.1.4 数据 类 型 与 数据 结构 

在 程序 设计 语言 中 给 出 定义 数据 类 型 与 数据 结构 的 合理 机 制 ， 是 语言 可 读 性 的 又 一 种 重要 
辅助 。 例 如 ， 假 设 在 某 种 语言 中 不 存在 布尔 数据 类 型 ， 数 值 数 据 类 型 就 被 用 来 作为 标志 。 在 这 
种 语言 中 ， 我 们 可 能 会 有 如 下 的 赋值 语句 : 

timeOut = 1 

这 条 语句 的 意义 是 不 清楚 的 ， 而 在 具有 布尔 数据 类 型 的 语言 中 ， 我 们 可 以 有 赋值 语句 

timeOut = true 

这 条 语句 的 意义 就 完全 清楚 了 。 同 样 地 ， 记 录 数 据 类 型 比 使 用 一 组 相似 数组 来 记录 雇员 档 
案 ， 其 可 读 性 更 好 ， 在 没有 记录 数据 类 型 的 语言 中 ， 就 必须 运用 这 些 相 似 数组 来 记录 这 种 信息 ， 
其 中 的 每 一 个 数组 记录 雇员 档案 中 的 一 列 数据 。 例 如 在 Fortran 95 中 ， 可 以 将 一 组 雇员 档案 的 记 
录 存 储 在 下 面 的 数组 之 中 : 
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Character (Len = 30):: Name (100) 

Integer :: Age (100), Employee Number (100) 

Real :: Salary (100) 

在 这 四 个 数组 之 中 ， 具 有 相同 下 标的 数组 元 素 记 录 着 某 一 个 雇员 的 资料 。 

1.3.1.5 语法 设计 

一 种 语言 的 组 成 元 素 的 语法 或 形式 对 程序 的 可 读 性 有 着 极为 重要 的 影响 。 下 面 的 三 个 例子 
说 明 语法 设计 的 选择 是 如 何 影 响 可 读 性 的 : 

"标识 符 形式 。 将 标识 符 的 长 度 限 制 得 很 短 会 降低 语言 的 可 读 性 。 如 果 像 在 Fortran 77 中 那 

样 ， 规 定 标识 符 的 长 度 最 多 不 能 超过 六 个 字符 ， 那 么 常常 很 难 赋予 变量 以 有 意义 的 名 字 。 
一 个 更 为 极端 的 例子 是 美国 国家 标准 协会 (ANSI) 关于 BASIC 语 言 的 原始 规定 (ANSI, 
1978b) ， 它 限制 标识 符 只 能 包含 单个 字母 ， 后 面 只 能 跟随 一 个 数字 。 其 他 有 关 标 识 符 形 
式 的 设计 问题 将 在 第 5 章 里 进行 讨论 。 

* 特殊 字 。 语 言 中 特殊 字 的 形式 (例如 ，while、class 和 for) 将 极 大 地 影响 程序 的 外 观 ， 
及 与 此 相关 联 的 程序 的 可 读 性 。 其 中 特别 重要 的 是 构造 复合 语句 或 语句 组 合 的 方式 ,万 
其 古 在 控制 结构 中 构造 复合 语句 的 方式 。 一 些 语 言 使 用 配对 的 特殊 字 或 者 特殊 符号 来 构 
迄 复 合 语句 。C 及 其 后 继 语言 使 用 括号 来 说 明 复 合 语句 。 所 有 这 些 语 言 都 有 相 类 似 的 麻烦 ， 
它们 的 复合 语句 总 是 以 同样 的 方式 终止 ， 当 出 现 endq 或 者 } 时 ， 人 们 很 难 判断 ， 究 竟 是 哪 
一 个 语句 组 合 应 该 被 结束 。Fortran 95 和 Ada 语 言 在 这 个 问题 上 则 较为 清晰 ， 它 们 对 不 同类 
型 的 复合 语句 采用 不 同 的 终止 语法 。 例 如 ，Ada 用 end if 来 终止 选择 结构 ， 而 用 ena 
loop 来 终止 循环 结构 。 这 仅 是 语言 的 简单 性 与 可 读 性 之 间 存在 矛盾 的 一 个 例子 ， 为 实现 
语言 的 简单 性 ， 则 定义 较 少 的 特殊 保留 词 ， 类 似 在 C++ 中 ， 为 实现 较 大 程度 的 可 读 性 ， 则 
使 用 较 多 的 保留 词 ， 类 似 在 Ada 中 的 那样 。 

力 外 一 个 重要 的 问题 是 ， 能 否 使 用 一 种 语言 的 特殊 字 作为 程序 中 的 变量 名 。 如 果 容 许 ， 这 

样 编写 的 程序 很 容易 引起 混淆 。 例 如 在 Fortran 95 中 ， 特 殊 字 如 Do 和 End， 就 是 合法 的 恋 

量 名 。 所 以 ， 当 这 些 词 在 程序 中 出 现时 ， 它 们 可 能 (也 可 能 ) 没有 包含 特殊 的 含义 。 

“形式 与 意义 。 设 计 程 序 语言 的 语句 时 ， 使 其 字面 形式 至 少 部 分 地 表明 它们 的 功用 。 这 对 

语言 的 可 读 性 有 着 明显 的 助 益 。 语 义 或 者 说 意义 应 该 紧 跟 语法 或 形式 。 但 有 了 时 两 种 语言 
在 结构 形式 上 相同 或 者 相似 ， 而 当 将 其 放置 于 不 同 的 位 置 时 ， 就 会 具有 不 同 的 语义 ， 这 
就 违反 了 上 述 原 则 。 例 如 在 C 语 言 中 ， 保留 字 static 的 语义 就 取决 于 它 所 出 现 的 位 置 。 
当 它 被 用 于 一 个 函数 中 的 变量 的 定义 时 ， 意 味 着 该 变量 是 在 编译 时 产生 的 。 当 它 被 用 于 
处 于 所 有 函数 之 外 的 变量 的 定义 时 ， 则 意味 着 该 变量 只 在 它 所 定义 的 文件 之 中 ， 而 不 能 
锌 输出 到 这 个 文件 以 外 。 

人 们 对 UNIX (Raymond, 2004) 系统 的 shel1 指 令 的 不 满 之 一 ， 是 它们 的 形式 并 非 总 是 
提示 它们 的 功能 。 例 如 对 于 UNIX 指 令 grep 功 能 的 辨认 ， 仅仅 只 能 通过 事先 对 于 它们 的 了 解 ， 
或 者 取决 于 人 们 的 聪明 才智 ， 以 及 对 于 UNIX 编 辑 器 ed 的 熟悉 程度 . 这 个 指令 的 字面 形式 对 
UNIX 的 初学 者 来 说 毫 无 帮助 。( 在 UNIX 编 辑 器 ed 中 ， 指令 /regular_expression/ 用 来 搜索 
与 正则 表达 式 相 匹配 的 子 字符 串 。 在 这 个 指令 的 前 面 放 上 g， 它 就 变 成 了 一 个 全 局 指令 ， 它 说 
明 现在 所 搜索 的 范围 是 正在 编辑 的 整个 文件 。 如 果 在 这 个 指令 的 后 面 再 加 上 p， 则 说 明 打 印 该 
文件 中 所 有 包含 匹配 子 字符 串 的 行 。 所 以 显而易见 地 ， 可 以 将 指令 g/regular 
expPression/P 缩 写 为 grep， 它 的 意义 是 : 打印 文件 中 所 有 包含 与 正则 表达 式 相 匹配 的 子 字 
符 串 的 行 。) 
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1.3.2 可 写 性 


程序 设计 语言 的 可 写 性 是 在 给 定 的 应 用 领域 内 对 该 语言 产生 程序 的 难 易 程 度 的 一 种 度量 。 
大 多 数 影响 可 读 性 的 语言 特征 也 可 以 影响 可 写 性 。 这 是 因为 在 编写 程序 的 过 程 中 ， 编 程 人 员 要 
不 断 地 阅读 已 经 编写 了 的 程序 部 分 。 

如 同 可 读 性 的 情形 一 样 ， 可 写 性 只 能 在 程序 设计 语言 所 针对 的 问题 领域 之 内 来 考虑 。 如 果 
在 一 个 特定 的 应 用 领域 内 比较 两 种 语言 的 可 写 性 ， 一 种 语言 是 专 为 这 种 应 用 而 设计 的 ， 而 另 一 
种 语言 则 不 是 ， 这 样 的 比较 是 不 合理 的 。 例 如 ，COBOL 与 Fortran 的 可 写 性 在 产生 处 理 二 维 数组 
的 程序 时 是 截然 不 同 的 ，Fortran 对 于 这 类 应 用 是 理想 的 。 在 涉及 产生 复杂 形式 的 财务 报告 时 ， 
这 两 种 语言 的 可 写 性 也 十 分 不 同 ， 而 COBOL 正 是 为 这 类 问题 所 设计 的 。 

在 下 面 的 几 个 小 节 里 ， 我 们 将 阐述 影响 程序 设计 语言 可 写 性 的 几 个 最 重要 的 特性 。 

1.3.2.1 简单 性 与 正 交 性 

如 采 一 种 程序 设计 语言 中 具有 大 量 的 不 同 结构 , 那么 一 些 编程 人 员 可 能 只 熟悉 它们 的 一 部 分 。 
这 种 情形 会 导致 一 些 语言 特性 被 误 用 ， 而 另外 的 一 些 则 被 忽略 。 那 些 被 忽略 的 特性 也 许 比 被 采用 
的 特性 能 够 写 出 更 加 漂亮 、 更 加 高 效 或 二 者 兼备 的 程序 来 。 更 有 其 者 ， 就 如 Hoare (1973) 所 指 
出 ， 人 们 可 能 会 意外 地 采用 一 些 他 们 所 不 理解 的 特性 ， 产 生出 莫名 其 妙 的 结果 。 所 以 ， 一 组 较 少 
量 的 基本 结构 以 及 一 套 相 互 一 致 的 组 合 规则 ( 即 正 交 性 ) ， 比 仅仅 具有 大 量 的 基本 结构 要 优越 得 
多 。 这 样 ， 程 序 人 员 在 学 会 了 一 套 简单 的 基本 结构 之 后 ， 就 能 针对 复杂 问题 设计 出 解决 办 法 。 

男 一 方面 ， 过 分 的 正 交 性 也 有 损 于 可 写 性 。 当 基本 结构 的 任意 结合 几乎 都 是 合法 时 ， 程 序 
中 的 错误 就 很 难 被 检测 出 来 。 这 也 会 导致 编译 器 不 能 够 发 现代 码 中 的 雇 误 。 

1.3.2.2 支持 抽象 

简 而 言 之 ， 抽 象 指 的 是 以 合法 省 略 许多 细节 的 方式 ， 来 定义 并 且 使 用 复杂 结构 或 复杂 运算 
的 能 力 。 在 当代 程序 设计 语言 的 设计 之 中 ， 抽 象 是 一 个 关键 性 的 概念 。 这 反映 了 抽象 在 现代 程 
序 设计 方法 学 中 所 起 的 主角 作用 。 一 种 程序 设计 语言 所 允许 的 抽象 程度 ， 以 及 这 种 抽象 表现 形 
式 的 自然 程度 ， 对 语言 的 可 写 性 是 非常 重要 的 。 程 序 设计 语言 可 以 支持 两 种 不 同类 型 的 抽象 ， 
即 过 程 抽象 与 数据 抽象 。 

过 程 抽象 的 一 个 简单 例子 ， 是 采用 子 程序 来 实现 在 程序 中 反复 运用 的 排序 算法 。 如 果 没 有 
于 程序 ， 这 段 排序 代码 将 重复 出 现 于 程序 中 所 有 需要 的 地 方 ， 这 使 得 程序 宛 长 ， 而 且 编写 的 过 
程 也 麻烦 得 多 。 尤 其 重要 的 是 ， 如 果 不 采 用 子 程序 ， 程 序 里 将 会 乱糟糟 地 充满 了 应 该 写 在 子 程 
序 中 的 排序 算法 的 细节 ， 这 将 使 程序 的 流程 和 总 意图 很 不 清楚 。 

作为 数据 抽象 的 一 个 例子 ， 考 虑 一 种 将 整数 数值 存储 于 其 节点 的 二 又 树 结构 。 在 一 种 类 似 
Fortran 77 的 、 不 支持 指针 、 并 且 不 支持 运用 堆 的 动态 存储 管理 的 语言 之 中 ， 这 种 二 又 树 结构 通 
和 前 被 实现 为 三 个 并 行 的 整数 数组 ， 其 中 的 两 个 整数 被 用 来 定义 子 节点 的 下 标 。 而 在 C++ 和 Java 
语言 中 ， 就 能 够 使 用 树 节点 的 抽象 来 实现 这 种 树 结构 ， 而 其 中 每 个 节点 的 形式 为 具有 两 个 指针 
(或 引用 ) 以 及 一 个 整数 的 简单 的 类 。 后 一 种 表示 方法 在 表达 形式 上 的 自然 性 ， 使 得 运用 这 类 话 
言 来 编写 具有 二 又 树 结构 的 程序 比 用 Fortran 77 编 写 要 容易 得 多 。 这 仅仅 是 因为 这 种 程序 设计 话 
言 解 决 问题 的 范畴 更 接近 实际 问题 的 领域 。 

对 抽象 是 否 全 面 支持 显然 是 影响 语言 可 写 性 的 重要 因素 。 

1.3.2.3 表达 性 

语言 的 表达 性 可 以 指 语言 中 几 种 不 同 的 特征 。 在 一 种 类 似 APL(Gilman & Rose,1984) 的 语言 
之 中 ， 它 指 的 是 这 些 语 言 所 具有 的 一 些 功能 很 强 的 运算 符 ， 这 些 运 算 符 仅 允 许 使 用 很 小 的 程序 
完成 极 大 量 的 运算 。 更 一 般 地 ， 表 达 性 是 指 一 种 程序 设计 语言 具有 相对 方便 、 非 繁琐 的 方式 来 
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说 明 运 算 。 例 如 ，C 中 的 表达 式 count++ 比 表达 式 count=count+1 更 为 方便 和 短小 精炼 。 还 
有 ，Ada 中 的 布尔 运算 符 and then 是 一 种 说 明 布 尔 表 达 式 短路 求 值 的 方便 方式 。 在 Java 语 言 
包括 进 for 语 句 ， 使 得 在 编写 计数 循环 时 比 使 用 while 语 句 更 为 容易 ， 尽 管 使 用 后 者 也 可 以 达 
到 同样 的 目的 。 所 有 的 这 些 都 增进 了 程序 设计 语言 的 可 写 性 。 


1.3.3 可 靠 性 


如 果 一 个 程序 在 任何 条 件 下 的 运行 都 能 够 达到 它 的 说 明 标准 ， 我 们 称 这 个 程序 是 可 靠 的 。 
下 面 我 们 将 阐述 在 特定 语言 中 ， 对 程序 可 靠 性 有 极 大 影响 的 一 些 语言 特性 。 

1.3.3.1 类 型 检测 

类 型 检测 就 是 用 编译 器 或 在 程序 的 运行 过 程 中 测试 给 定 程序 中 的 类 型 错误 。 类 型 检测 是 语 
言 可 靠 性 中 的 一 个 重要 因素 。 编 译 时 的 类 型 检测 要 比 运行 时 的 类 型 检测 更 为 理想 ， 因 为 运行 时 
的 类 型 检测 是 高 代价 的 。 程 序 中 的 错误 发 现 得 越 早 ， 改 正 错 误 的 代价 就 越 低 。Java 的 设计 要 求 
在 编译 时 对 几乎 所 有 的 变量 及 所 有 的 表达 式 都 进行 类 型 检测 。 这 种 方法 实际 上 消除 了 Java 程 序 
运行 时 的 类 型 错误 。 我 们 将 在 第 5 章 和 第 6 章 深 入 讨论 类 型 以 及 类 型 检测 。 

一 个 因为 没有 类 型 检测 而 导致 无 数 程序 错误 的 典型 例子 ， 是 在 早期 的 C 语 言 (Kernighan 
and Ritchie，1978) 中 使 用 的 子 程序 参数 ， 它 不 在 编译 时 ， 甚 至 也 不 在 运行 时 实施 类 型 检测 。C 
不 检测 函数 调用 语句 中 的 实 参 类 型 ， 以 确定 该 实 参 的 类 型 是 否 与 函数 定义 中 的 形 参 类 型 相 一 致 。 
一 个 在 函数 调用 中 被 作为 实 参 的 int 类 型 变量 可 以 被 传递 给 一 个 期 待 以 ELoat 类 型 作为 形 参 的 
函数 ， 之 后 其 至 无 论 是 编译 器 或 者 运行 系统 都 不 能 够 发 现 这 种 不 一 臻 性。 例如， 表示 整数 23 的 
位 字 位 串 与 表示 浮 点 数 23 的 字 位 串 是 根本 不 相关 的 。 如 果 将 一 个 整数 23 传 递 给 一 个 期 待 浮 点 数 
参数 的 函数 ， 必 然 地 ， 在 该 函数 中 任何 对 这 个 参数 的 使 用 都 会 产生 毫 无 意义 的 结果 。 更 有 胜 之 ， 
这 类 问题 常常 很 难 被 发 现 ”。 目 前 的 C 语 言 版 本 通过 要 求 对 所 有 的 参数 都 进行 类 型 检测 ， 从 而 消 
除了 这 类 问题 。 有 关子 程序 以 及 参数 传递 的 技术 将 在 第 9 章 中 讨论 。 

1.3.3.2 异常 处 理 

一 个 程序 如 果 具 有 中 断 运 行 时 错误 (以 及 这 个 程序 所 发 现 的 其 他 非 正 常情 况 ) 并 改正 错误 
然后 继续 运行 的 这 种 能 力 ， 将 显然 有 助 于 提高 程序 的 可 靠 性 。 这 种 程序 设计 语言 的 机 制 就 称 为 
异常 处 理 。Ada、C++ 和 Java 语 言 都 具有 用 于 异常 处 理 的 庞大 机 制 ， 而 这 种 机 制 在 许多 广泛 应 用 
的 程序 设计 语言 中 (包括 C 和 Fortran)， 实 际 上 并 不 存在 。 异 常 处 理 的 问题 将 在 第 14 章 中 讨论 。 

1.3.3.3 使 用 别名 

使 用 别名 的 非 严 格 定义 是 ， 用 两 个 或 多 个 名 字 来 访问 同一 个 存储 单元 。 现 在 人 们 已 经 普遍 
地 意识 到 ， 使 用 别名 是 程序 设计 语言 中 的 一 个 危险 特性 。 大 多 数 的 程序 设计 语言 允许 一 定 程度 
的 别名 使 用 ， 例 如 在 大 多 数 语 言 中 都 有 可 能 将 两 个 指针 指向 同一 个 变量 。 程 序 人 员 必 须 时 刻 记 
住 ， 在 这 样 的 程序 中 ， 如 果 这 两 个 指针 中 的 一 个 所 指向 的 数值 改变 了 ， 将 引起 另外 一 个 指针 所 
引用 的 数值 的 改变 。 在 第 5 章 和 第 9 章 将 要 讲 到 ， 有 一 些 类 型 的 别名 使 用 能 够 被 一 种 语言 的 设计 
所 禁止 。 

一 些 语言 靠 使 用 别名 来 克服 其 数据 抽象 机 制 的 低 效率 ， 而 另 一 些 语言 则 严格 禁止 使 用 别名 
以 提高 语言 的 可 靠 性 。 


O 针对 这 个 同 题 ， 以 及 其 他 一 些 相 类 似 的 问题 ，UNIX 系 统 包 括 了 一 种 命名 为 1int 的 功能 程序 ， 这 个 程序 将 检 
测 C 程 序 中 的 这 类 问题 。 
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1.3.3.4 可 读 性 与 可 写 性 

可 读 性 与 可 写 性 都 会 影响 到 可 靠 性 。 如 果 编 写 程序 的 语言 不 具有 表达 所 需 算法 的 自然 方式 ， 
就 必然 会 采用 非 自 然 方式 。 非 自然 的 方法 不 能 保证 在 所 有 可 能 的 情况 下 都 是 正确 的 。 一 个 程序 
越 容易 编写 ， 则 其 正确 的 可 能 性 就 越 大 。 

在 软件 生命 周期 中 的 编写 与 维护 阶段 ， 程 序 的 可 读 性 都 会 影响 其 可 靠 性 。 难 于 阅读 的 程序 
也 难于 编写 和 修改 。 


1.3.4 代价 


程序 设计 语言 的 最 终 总 代价 是 这 种 语言 中 各 种 特征 的 一 个 函数 。 

第 一 是 训练 程序 员 使 用 这 种 语言 所 具有 的 代价 。 这 种 代价 是 语言 的 简单 性 与 正 交 性 ， 以 及 
程序 人 员 以 往 经 验 的 一 个 函数 。 尽 管 功能 更 强大 的 程序 设计 语言 不 一 定 就 更 难 掌 握 ， 但 通常 的 
情形 却 往 往 是 这 样 的 。 

第 二 是 使 用 这 种 语言 来 编写 程序 所 具有 的 代价 。 这 种 代价 是 程序 设计 语言 可 写 性 的 一 个 函 
数 ， 它 部 分 地 取决 于 这 种 语言 的 设计 目的 与 特定 应 用 问题 的 接近 程度 。 设 计 和 实现 高 级 语言 也 
初始 目标 就 是 降低 软件 开发 的 代价 。 

在 优良 的 程序 开发 环境 中 ， 一 种 语言 的 程序 人 员 培 训 代 价 以 及 程序 编写 代价 都 能 够 极 大 地 
降低 。 关 于 程序 设计 的 环境 问题 ， 我 们 将 在 1.8 市 讨论 。 

第 三 是 在 这 种 语言 中 编译 程序 的 代价 。 早 期 Ada 语 言 应 用 的 一 个 主要 障碍 是 当时 的 第 一 代 
Ada 编 译 器 让 人 性 步 的 高 运行 代价 。 随 着 更 好 的 Ada 编 译 器 的 出 现 ， 这 个 问题 已 经 得 以 解决 。 

第 四 是 程序 运行 的 代价 。 一 种 语言 的 设计 方式 极 大 地 影响 着 用 这 种 语言 所 编写 的 程序 的 运 
行 代 价 。 无 论 该 语言 编译 器 的 质量 如 何 ， 要 求 进行 大 量 运 行 时 类 型 检测 的 语言 必 将 阻碍 代码 的 
高 速 执行 。 尽 管 在 早期 的 语言 设计 中 ， 程 序 的 执行 效率 是 最 优先 考虑 的 因素 ， 然 而 现在 却 认为 
不 是 那么 重要 了 。 

在 被 编译 的 代码 上 ， 其 编译 代价 与 运算 速度 之 间 存 在 着 一 种 简单 的 权衡 。 一 系列 被 称 为 优 
化 的 技术 可 以 使 得 编译 器 减 小 它 所 产生 的 代码 的 规模 ， 以 及 /或 者 提高 这 些 代码 的 执行 速度 。 如 
果 在 编译 过 程 不 做 或 者 仅仅 做 很 少 的 优化 ， 编 译 过 程 就 会 比 花 费 很 大 努力 来 产生 优化 编码 的 情 
形 要 快 得 多 。 而 在 这 些 编译 过 程 所 做 的 额外 努力 将 导致 代码 执行 的 高 效率 。 两 种 情形 应 该 如 何 
选择 ， 取 决 于 编译 器 将 要 运用 的 环境 。 对 于 学 习 初 级 程序 设计 的 学 生 ， 则 不 需要 或 者 只 需要 很 
少 的 优化 ， 因 为 学 生 们 使 用 大 量 的 时 间 来 编译 程序 ， 而 只 使 用 很 少 的 执行 时 间 (他 们 的 程序 很 
小 ， 并且 只 需要 一 次 正确 的 执行 )。 而 在 生产 环境 中 ， 编 译 过 的 程序 会 需要 多 次 执行 ， 这 必然 值 
得 付出 额外 的 代价 来 优化 代码 了。 

第 五 是 一 种 语言 实现 系统 的 代价 。 人 们 之 所 以 很 快 就 接受 Java 语 言 的 原因 之 一 ， 是 该 语言 
免费 的 编译 器 /解释 器 系统 ， 在 Java 语 言 设计 第 一 次 公布 之 后 的 短 时 期 内 ， 很 快 便 能 免费 下 载 它 
的 编译 器 /解释 器 系统 。 如 果 一 种 语言 的 实现 系统 价格 昂贵 ， 或 者 只 限于 运行 在 价格 昂贵 的 硬件 
设备 之 上 ， 这 种 语言 被 广泛 应 用 的 机 会 就 要 小 得 多 。 例 如 ， 第 一 代 Ada 语 言 编译 器 的 高 昂 代 价 
就 曾经 在 早期 阻止 了 Ada 成 为 广泛 应 用 的 语言 。 

第 六 是 可 靠 性 差 的 代价 。 如 果 软 件 在 一 个 关键 系统 中 出 错 ， 如 在 一 个 核电 站 或 在 一 台 医 用 
X 光 机 上 出 错 ， 这 种 代价 可 能 会 非常 高 。 在 非 关 键 系 统 中 出 错 ， 如 采 考 虑 到 有 可 能 失去 今后 的 
生意 ， 或 者 因 残 次 软件 系统 而 造成 官司 ， 其 代价 也 可 能 会 非常 昂 贯 。 

最 后 要 考虑 的 一 点 是 程序 维护 的 代价 。 程 序 维护 包括 程序 的 改 错 ， 以 及 为 增加 新 功能 而 进 
行 的 修改 。 这 种 软件 维护 的 代价 取决 于 语言 的 许多 特征 ， 但 主要 是 语言 的 可 读 性 。 因 为 维护 工 
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作 常 常 由 非 软件 原始 编写 人 员 担 任 ， 可 读 性 差 的 程序 必 将 使 维护 工作 极为 艰难 。 

软件 维护 的 重要 性 无 论 怎么 强调 都 不 会 言 过 其 实 。 据 估计 ， 对 于 使 用 期 相对 长 的 大 型 软件 
系统 ， 软 件 维护 的 代价 可 以 是 软件 开发 代价 的 2~4 倍 (Sommerville, 2005) , 

在 影响 程序 设计 语言 代价 的 所 有 因素 之 中 ， 三 种 因素 最 为 重要 ， 即 程序 开发 、 软 件 维护 及 
可 靠 性 。 由 于 这 三 种 代价 又 都 是 可 写 性 与 可 读 性 的 函数 ， 由 此 可 得 出 结论 ， 可 写 性 与 可 读 性 就 
成 为 评估 程序 设计 语言 的 两 种 最 重要 的 标准 。 

当然 ， 其 他 的 一 些 标准 也 可 以 用 来 评估 程序 设计 语言 。 其 中 的 一 个 例子 就 是 可 移植 性 ， 即 
一 个 程序 能 够 从 一 种 实现 转移 到 另 一 种 实现 的 难 易 程 度 。 可 移植 性 又 极 受 语言 的 标准 化 程度 的 
影响 。 某 些 程序 设计 语言 ， 例 如 BASIC， 就 根本 没有 实现 标准 化 ， 用 这 些 语言 编写 的 程序 就 很 
难 从 一 种 实现 转移 到 另 一 种 实现 。 程 序 设计 语言 的 标准 化 是 一 个 耗 时 又 艰难 的 过 程 。 有 亲 个 委员 
会 从 1989 年 开始 起 草 C++ 语 言 的 一 种 标准 版 本 ， 而 这 个 版 本 直到 1998 年 才 最 终 被 批准 。 

语言 的 通用 性 (在 广泛 范围 内 可 应 用 的 程度 ) 及 定义 良好 性 (程序 设计 语言 官方 定义 文档 
的 完整 性 及 准确 程度 ) 是 另外 两 种 评估 语言 的 标准 。 

绝 大 多 数 的 评估 标准 ， 尤 其 是 可 读 性 、 可 写 性 及 可 靠 性 ， 既 不 是 精确 定义 的 ， 也 不 可 以 精 
确 测量 。 然 而 它们 是 很 有 用 的 概念 ， 它 们 提供 了 有 关 程 序 设 计 语言 的 设计 及 其 评估 方面 的 极 有 
价值 的 观念 。 

程序 设计 语言 评估 标准 的 最 后 一 个 要 点 : 语言 设计 的 标准 随 着 不 同人 员 的 不 同 角 度 而 有 着 
不 同 的 侧重 。 语 言 的 实现 人 员 主 要 关心 的 是 实现 这 种 语言 的 构造 及 其 特性 所 可 能 遭遇 的 困难 。 
语言 的 使 用 人 员 则 首先 担心 的 是 可 写 性 ， 其 次 是 可 读 性 。 语 言 的 设计 人 员 则 喜欢 强调 语言 的 优 
美 ， 以 及 吸引 人 们 广泛 应 用 语言 的 能 力 。 但 所 有 这 些 特 征 有 时 又 是 相互 矛盾 的 。 


1.4 影响 语言 设计 的 因素 


除了 在 1.3 节 中 阐述 的 那些 因素 以 外 ， 还 有 一 些 因素 会 影响 到 程序 设计 语言 的 基本 设计 。 其 
中 最 为 重要 的 是 计算 机 体系 结构 及 程序 设计 方法 学 。 


1.4.1 计算 机 体系 结构 


计算 机 的 基本 体系 结构 对 语言 的 设计 有 着 次 远 的 影响 。 在 过 去 50 年 中 ， 绝 大 多 数 广 为 应 用 
的 语言 都 是 依据 一 种 普遍 流行 的 计算 机 结构 来 设计 的 ， 这 种 结构 被 称 为 汉 : 诺 依 曼 (von 
Neumann) 体系 结构 ， 这 个 名 字 取 自 它 的 初创 者 之 一 , John von Neumann (发 音 为 “von Noyman”)。 
这 种 类 型 的 语言 被 称 为 命令 式 语言 。 在 色 : 诺 依 曼 计算 机 中 ， 数 据 与 程序 都 被 存储 于 同一 个 存 
储 器 。 执 行 指令 的 中 央 处 理 避 (CPU) 与 存储 器 是 分 开 的 。 因 而 ， 指 令 与 数据 必须 从 存储 器 传 
输 到 CPU ， 而 CPU 运行 的 结果 又 必须 传 回 存储 器 。 几 乎 所 有 自 20 世 纪 40 年 代 以 来 生产 的 数字 计 
算 机 ， 都 是 基于 冯 “ 诺 依 曼 体系 结构 的 。 图 1-1 显 示 了 汉 … 诺 依 曼 计 算 机 的 整体 结构 。 

由 于 冯 “ 诺 依 曼 体 系 结构 ， 命 令 式 语言 的 核心 特性 有 : 模拟 存储 单元 的 变量 、 基 于 传输 操 
作 的 赋值 语句 ， 以 及 迭代 形式 的 循环 运算 一 一 这 是 一 种 在 冯 : 诺 依 曼 体系 结构 上 实现 重复 操作 
的 最 高 效 方 式 。 表 达 式 中 的 操作 数 从 存储 器 传 向 CPU ， 而 表达 式 的 运算 结果 又 被 传 回 到 由 赋值 
语句 左 端 所 代表 的 存储 单元 上 。 由 于 运算 指令 顺序 地 存储 于 相 邻 的 存储 单元 ， 并 且 一 小 段 代码 
的 重复 执行 只 需要 一 个 简单 的 分 支 指令 ， 所 以 在 色 : 诺 依 曼 计 算 机 上 和 迭代 式 循环 是 高 速 的 。 这 
种 高 效率 不 鼓励 使 用 递归 式 循环 ， 尽 管 递归 式 循环 常常 更 为 自然 。 
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存储 器 (存储 指令 和 数据 ) 


输入 输出 设备 


中 央 处 理 器 
图 1-1 + 诺 依 曼 计 算 机 体系 结构 


在 码 : 诺 依 曼 体系 结构 计算 机 上 上 ， 机 器 码 程序 的 执行 发 生 于 被 称 为 取 指 -执行 周期 的 过 程 
中 。 如 在 1.4.1 节 所 述 ， 程 序 存储 于 存储 器 内 ， 但 在 CPU 上 执行 。 必 须 将 每 一 条 要 执行 的 指令 从 
仓储 器 转移 到 中 央 处 理 器 。 下 一 条 要 执行 的 指令 的 地 址 则 保存 在 一 个 被 称 为 程序 计数 器 的 寄存 
丝 之 中 。 取 指 -执行 周期 可 以 简单 地 由 下 面 的 算法 来 描述 

初始 化 程序 计数 器 

永远 地 重复 

取出 程序 计数 器 指向 的 指令 
增值 程序 计数 器 以 指向 下 一 条 指令 
解码 指令 

执行 指令 

结束 重复 

算法 中 的 “解码 指令 ”步骤 意味 着 检查 指令 ， 以 确定 这 条 指令 所 说 明 的 动作 。 当 遇 到 一 
条 停止 指令 时 ， 程 序 的 执行 即 被 终止 ， 尽 管 在 实际 的 计算 机 上 极 少 执行 停止 指令 。 控 制 则 正 
好 相反 ， 是 从 操作 系统 送 至 用 户 程序 使 之 执行 ， 而 当 用 户 程序 的 执行 完毕 之 后 ， 再 传 回 操作 
系统 。 如 采 在 一 个 计算 机 系统 中 ， 同 时 有 多 个 用 户 程序 存在 于 存储 器 中 ， 这 样 的 过 程 就 要 复 
杂 得 多 。 

如 前 所 述 ， 函 数 式 (或 称 作用 式 ) 语言 进行 计算 的 主要 方式 是 将 函数 作用 于 给 定 参数 之 上 。 
在 图 数 式 语 言 中 的 程序 设计 可 以 没有 命令 式 语言 所 必需 的 那 种 变量 ， 可 以 没有 赋值 语句 ， 也 可 
以 没有 循环 。 尽 管 许多 计算 机 科学 工作 者 为 函数 式 语言 的 极 大 优越 性 做 出 了 详细 的 说 明 ， 如 
Scheme 语 言 ， 然 而 在 一 种 能 够 允许 函数 式 语言 程序 高 效率 运行 的 、 非 汉 : 诺 依 曼 体系 结构 的 计 
算 机 出 现 之 前 ， 函 数 式 语言 是 不 可 能 替代 命令 式 语言 的 。 在 为 这 种 现实 忱 惜 不 止 的 人 中 ， 最 具 
雄辩 力 的 莫 过 于 Fortran 语 言 早 期 版 本 的 主要 设计 者 John Backus (Backus, 1978), 

在 过 去 25 年 间 产 生 的 并 行 体系 结构 计算 机 ， 具 有 加 快 函 数 式 程序 的 执行 速度 的 希望 。 然 而 
迄今 为 止 ， 这 种 函数 式 程序 的 执行 速度 仍然 不 足以 与 命令 式 程序 的 执行 速度 相 比 。 事 实 上 RN 
管 存在 着 使 用 并 行 体系 结构 来 执行 函数 式 程序 的 好 的 方式 ， 但 大 多 数 并 行 机 仍 被 用 于 命令 式 程 
序 ， 特 别 是 用 于 那些 使 用 Fortran 的 方言 所 编写 的 程序 。 

尽管 事实 上 ， 命 令 式 程序 设计 语言 模拟 的 是 机 器 的 系统 结构 ， 而 并 不 是 基于 语言 的 使 用 大 
员 的 能 力 及 倾向 ， 但 仍然 有 一 些 人 认为 ， 使 用 命令 式 程序 设计 语言 在 某 种 程度 上 比 使 用 函数 式 
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程序 设计 语言 更 为 自然 。 
1.4.2 程序 设计 方法 学 

从 20 世 纪 60 年 代 末 期 至 70 年 代 初 期 ， 由 于 结构 化 程序 设计 运动 的 兴起 ， 人 们 开始 深入 分 析 
软件 开发 的 过 程 及 程序 设计 语言 的 设计 问题 。 

当时 开展 这 种 研究 的 一 个 重要 原因 是 ， 随 着 硬件 成 本 的 降低 及 软件 费用 的 增加 ， 计 算 机 的 
主要 代价 从 硬件 转向 了 软件 。 当 时 程序 开发 人 员 生 产 效率 的 提高 相对 很 少 ， 加 之 ， 计 算 机 被 用 
来 解决 规模 越 来 越 大 、 越 来 越 复杂 的 问题 。 这 些 计算 问题 不 再 如 20 世 纪 60 年 代 初 期 那样 ， 仅 仅 
古 解 方程 组 以 模拟 卫星 的 轨迹 ;人 们 已 经 开始 在 为 巨大 和 复杂 的 任务 编写 程序 ， 如 控制 庞大 的 
炼油 设备 ， 提 供 全 球 性 的 航空 订 票 系统 。 

作为 20 世 纪 70 年 代 的 研究 成 果 产 生 的 新 的 软件 开发 方法 学 被 称 为 自 顶 向 下 设计 、 逐 步 求 精 。 
当时 ， 发 现 程序 设计 语言 的 主要 缺点 是 不 完全 的 类 型 检测 ， 以 及 不 适宜 的 控制 语句 (需要 运用 
太 多 的 goto 语 句 )。 

在 20 世 纪 70 年 代 的 后 期 ， 开 始 了 从 面向 过 程 转移 到 面向 数据 的 程序 设计 方法 学 。 面 向 数据 
的 方法 着 重 于 数据 的 设计 ， 这 种 方法 的 注意 力 集中 于 运用 抽象 的 数据 类 型 来 解决 问题 。 

要 将 数据 抽象 有 效 地 应 用 于 软件 系统 设计 ， 其 实现 语言 必须 能 够 支持 这 种 数据 抽象 。 
SIMULA 67 (Birtwistle et al., 1973) 是 第 一 种 对 数据 抽象 提供 有 限 支持 的 程序 设计 语言 ， 尽 
管 这 个 语言 的 本 身 事实 上 并 没有 因此 而 得 到 普及 。 直 到 20 世 纪 70 年 代 初 期 ， 人 们 才 普 遍地 认识 
到 运用 数据 抽象 的 优越 性 。 因 而 自 20 世 纪 70 年 代 末 期 以 来 所 设计 的 大 部 分 程序 语言 都 支持 数据 
抽象 。 数 据 抽象 的 问题 将 在 第 11 章 中 详细 讨论 。 

在 面向 数据 的 软件 开发 的 演进 中 ， 最 后 的 一 步 是 始 于 20 世 纪 80 年 代 初期 的 面向 对 象 的 程序 
设计 。 面 向 对 象 的 程序 设计 方法 学 开始 于 数据 抽象 。 这 种 方法 将 数据 处 理 与 数据 对 象 封 装 在 一 
起 ， 并 控制 对 数据 的 访问 ， 并 添加 了 继承 与 动态 方法 绑 定 。 继 承 是 一 个 功能 强大 的 概念 ， 它 大 
大 地 提高 了 重用 现 有 软件 的 潜能 ， 从 而 提供 了 大 幅 提 高 软件 开发 效率 的 可 能 性 。 这 是 使 得 面向 
对 象 的 程序 设计 语言 广 为 普 及 的 一 个 重要 因素 。 动 态 (运行 时 ) 方法 绑 定 使 得 对 于 继承 的 运用 
变 得 更 为 灵活 。 

面 站 对 象 的 程序 设计 是 伴随 着 一 种 支持 这 种 概念 的 程序 设计 语言 Smalltalk (Goldberg and 
Robson, 1989) 而 发 展 起 来 的 。 尽 管 Smalltalk 语 言 从 来 没有 像 其 他 程序 设计 语言 那样 被 广泛 普 
及 地 应 用 ， 但 它 所 采取 的 支持 面向 对 象 程 序 设计 的 方法 ， 如 今 已 成 为 最 为 广泛 流行 的 命令 式 语 
言 的 组 成 部 分 ， 这 里 包括 Ada 95 (ARM，1995) 、Java 和 C++。 面 向 对 象 的 原理 也 进入 了 CLOS 
(Bobrow et al., 1988) 语言 中 的 函数 式 程 序 设 计 ， 并 且 还 进入 了 Prolog++ (Moss, 1994) 语 言 中 的 
逻辑 式 程序 设计 。 关 于 支持 面向 对 象 程序 设计 的 语言 ， 我 们 将 在 第 12 章 中 详细 讨论 。 

在 茶 种 意义 上 ， 面 向 过 程 的 程序 设计 是 面向 数据 程序 设计 的 反面 。 尽 管 当今 面向 数据 的 方 
法 在 软件 开发 中 占据 统领 地 位 ， 然 而 面向 过 程 的 方法 也 没有 被 抛弃 。 相 反 ， 人 们 近年 来 进行 了 
大 量 关 于 面向 过 程 的 程序 设计 方法 的 研究 ， 尤 其 是 在 并 发 性 方面 的 研究 。 这 些 研究 工作 引发 了 
用 于 产生 与 控制 并 发 程序 单元 的 语言 工具 的 需求 。Ada，Java 和 C# 都 包括 了 这 项 功能 。 并 发 性 
问题 将 在 第 13 章 里 详细 讨论 。 


1.5 语言 分 类 


程序 设计 语言 通常 可 以 被 分 为 四 类 : 命令 式 语言 、 函 数 式 语言 、 逻 辑 语言 ， 以 及 面向 对 象 
的 语言 。 我 们 已 经 讨论 了 命令 式 语言 和 函数 式 语言 的 特点 ， 我 们 也 阐述 了 最 流行 的 面向 对 象 语 
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过 程 的 流程 有 极 大 不 同 ， 但 使 一 种 命令 式 语 言 也 能 够 支持 面向 对 象 的 程序 设计 所 需 做 的 扩展 工 
作 并 不 巨大 。 例 如 ，C 语 言 与 Java 语 言 中 的 表达 式 、 赋 值 语句 以 及 控制 语句 几乎 都 是 相同 的 。 
(但 另 一 方面 ，Java 中 的 数组 、 子 程序 和 语义 与 C 却 大 不 相同 。) 类 似 的 语句 能 用 于 支持 面 癌 对 象 
程序 设计 的 函数 式 语言 。 

另 一 类 语言 ， 可 视 化 语言 ， 形 成 了 命令 式 语言 的 一 个 子 类 。 可 视 化 语言 中 最 为 流行 的 古 
Visual BASIC (Schneider, 1999), Visual BASIC 现 在 已 经 由 Visual BASIC.NET (Deitel, et al., 2002) 
所 替代 。 这 类 语言 (或 者 是 这 类 语言 的 实现 ) 包括 了 以 “ 拖 放 ”方式 产生 代码 段 的 功能 。 这 类 
语言 曾经 被 称 为 第 四 代 程 序 设计 语言 ， 当 然 ， 这 个 名 称 现在 又 已 经 被 弃 用 了 。 可 视 化 语言 的 一 
种 代表 性 特性 是 提供 了 生成 程序 的 图 形 用 户 界面 的 简单 方式 。 例 如 在 Visual BASIC 中 ， 单 击 某 
个 键 便 能 产生 显示 表单 控件 的 代码 ， 例 如 一 个 按钮 或 一 个 文本 框 。 现 在 ， 所 有 的 .NET 语 言 都 实 
现 了 这 些 功能 。 

逻辑 程序 设计 语言 是 基于 规则 的 语言 的 范例 。 在 命令 式 语 言 中 ， 必 须 对 一 个 算法 施 以 详尽 
说 明 ， 并 且 其 中 还 必须 包括 执行 这 些 指令 或 语句 的 顺序 。 而 在 一 种 基于 规则 的 语言 中 ， 规 则 的 
说 明 并 不 需要 一 定 的 顺序 ， 但 语言 的 实现 系统 则 必须 选择 一 种 执行 顺序 以 取得 预期 的 结果 。 这 
种 软件 开发 的 方式 与 其 他 三 种 类 型 的 语言 所 使 用 的 方式 是 根本 不 同 的 ， 因 而 它 所 需要 的 是 一 种 
完全 不 同类 型 的 语言 。 我 们 将 在 第 16 章 中 讨论 最 第 用 的 逻辑 程序 设计 语言 Prolog， 以 及 关于 逻 
辑 程序 设计 的 问题 。 

近年 出 现 了 一 种 新 类 型 的 语言 ， 即 标记 与 程序 设计 混合 语言 。 标 记 语 言 ， 包 括 最 广 为 应 用 
的 XHTML 标 记 语 言 ， 并 非 程序 设计 语言 。 这 种 语言 仅 被 用 来 说 明 信 息 在 Web 文 档 中 的 布局 。 然 
而 ， 一 些 程序 设计 的 功能 已 经 蔓延 进 XHTML 及 XML 语 言 的 某 些 扩展 形式 中 。 我 们 所 指 的 这 些 
扩展 形式 包括 Java Server Pages Standard Tag Library (JSTL) 和 eXtensible Stylesheet Language 
Transformations (XSLT)。 这 两 种 语言 将 在 第 2 章 中 简略 地 介绍 。 

在 过 去 的 40 多 年 里 ， 出 现 了 一 系列 特殊 用 途 语 言 。 这 些 语言 从 生成 商务 报告 的 Report 
Program Generator (RPG) 到 用 作 指 示 可 编程 机 器 的 工具 的 Automatically Programmed Tools 
(APT)， 再 到 用 于 系统 模拟 的 General Purpose Simulation System (GPSS)。 主 要 因为 这 些 语言 应 用 
领域 狭 罕 ， 很 难 将 它们 与 其 他 语言 进行 比较 ， 因 此 本 书 将 不 会 讨论 特殊 用 途 语言 。 


1.6 语言 设计 中 的 权衡 


在 1.31 中 所 前 述 的 关于 程序 设计 语言 的 评估 标准 给 语言 的 设计 提供 了 一 个 框架 ， 但 遗憾 的 
是 ， 这 个 框架 又 是 日 相 了 矛盾 的 。Hoare (1973) 在 他 关于 语言 设计 的 论文 中 深刻 的 指出 :“ 存 在 
着 这 么 多 重要 、 但 又 刻 盾 的 标准 ， 以 至 于 使 它们 之 间 的 相互 协调 与 满足 成 为 了 一 项 主要 的 工程 
任务 。 

两 个 相互 矛盾 的 标准 是 可 靠 性 与 执行 代价 。 例 如 ，Java 语 言 的 定义 要 求 : 必须 对 所 有 数组 
元 素 的 ?| 用 进行 检测 ， 以 保证 所 有 下 标 都 在 合法 的 范围 之 内 。 这 个 步骤 给 包含 大 量 数组 元 素 引 
用 的 Java 程 序 增加 了 很 大 的 执行 代价 。C 语 言 不 要 求 进行 下 标 范围 的 检测 ， 所 以 C 程 序 的 执行 速 
度 比 语义 上 相同 的 Java 程 序 要 快 得 多 ， 当 然 Java 程 序 则 更 为 可 靠 。Java 语 言 的 设计 人 员 以 程序 执 
行 效率 为 代价 换取 了 可 靠 性 。 

直接 导致 设计 权衡 的 、 相 互 矛 盾 的 标准 的 另 一 个 例子 是 APL 语 言 。APL 语 言 具 有 一 整套 
功能 强大 、 用 于 数组 操作 数 的 运算 符 。 因 为 这 些 运 算 符 的 数目 很 大 ，APL 必 须 引 入 大 量 的 新 
从 号 来 表达 这 些 运算 符 。 另 外 ， 多 个 APL 运 算 符 可 以 同时 用 于 同一 元 长 、 复 杂 的 表达 式 中 。 
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作为 这 种 表达 性 高 的 一 种 结果 是 ， 对 于 那些 具有 多 个 数组 运算 的 应 用 ，APL 语 言 的 可 写 性 很 
高 。 的 确 ， 只 需要 一 个 十 分 短小 紧凑 的 程序 就 能 进行 大 量 的 计算 。 然 而 它 的 另 一 个 结 采 则 古 ， 
APL 程 序 的 可 读 性 极 差 。 紧 凑 精 练 的 表达 式 具 有 一 定 程度 上 的 数学 形式 美 ， 然 而 却 让 非 程序 
编写 者 的 其 他 人 员 难 于 理解 。 著 名 的 作者 Daniel McCracken 曾 经 写 到 ， 他 花费 了 四 个 小 时 来 
阅读 和 理解 一 个 仅 有 四 行 的 APL 程 序 (McCracken，1970)。APL 语 言 的 设计 者 以 可 读 性 为 代 
价 换取 了 可 写 性 。 

可 写 性 与 可 靠 性 之 间 的 矛盾 是 语言 设计 中 的 一 对 普遍 矛盾 。C++ 中 的 指针 可 以 以 各 种 不 同 
的 方式 来 操作 ， 这 导致 了 C++ 中 数据 寻 址 的 高 度 灵活 性 。 因 为 指针 所 具有 的 潜在 可 靠 性 问题 ， 
Java 没 有 包括 这 样 的 方式 。 

矛盾 存在 于 语言 设计 (以 及 语言 评估 ) 的 标准 之 中 ， 这 样 的 例子 举 不 胜 举 ， 有 一 些 过 于 做 
妙 ， 另 一 些 则 较为 明显 。 然 而 很 明显 ， 设 计 一 种 程序 设计 语言 时 ， 在 对 语言 的 结构 及 特性 进行 
选择 的 工作 中 ， 包 含 着 一 系列 的 妥协 与 权衡 。 

1.7 实现 方法 

如 1.4.1 节 所 述 ， 计 算 机 的 两 个 主要 组 成 部 分 是 它 内 部 的 存储 恬 及 处 理 右 。 内 部 存储 器 被 用 
来 存储 程序 和 数据 ， 处 理 器 则 是 一 组 电路 ， 用 来 实现 一 系列 的 基本 运算 或 机 器 指令 ， 如 进行 
术 运 算 和 逻辑 运算 的 指令 。 在 大 多 数 计算 机 中 ， 有 一 些 指令 通常 被 称 为 宏 指 令 ， 实 际 上 这 些 指 
令 是 通过 定义 于 更 低层 次 的 指令 〈 称 为 微 指令 ) 来 实现 的 。 因 为 微 指令 从 不 在 软件 中 显示 ， 因 
此 我 们 在 这 里 不 对 它们 作 进 一 步 的 讨论 。 

计算 机 的 机 器 语言 是 一 套 指令 。 在 没有 其 他 支持 软件 的 情况 下 ， 机 器 语言 是 大 多 数 硬件 计 
算 机 能 够 “理解 ”的 唯一 语言 。 理 论 上 ， 也 可 以 这 样 来 设计 和 建造 一 台 计 算 机 ， 即 可 以 使 用 一 
种 特殊 的 高 级 语言 作为 它 的 机 器 语言 。 但 这 样 建造 的 计算 机 会 十 分 复杂 且 非 常 昂贵 。 此 外 也 会 
极 不 灵活 ， 因 为 很 难 通 过 其 他 的 高 级 语言 来 使 用 它 (尽管 并 非 不 可 能 )。 计 算 机 设计 中 较 现实 的 
选择 是 ， 在 其 硬件 上 实现 能 够 提供 最 普遍 需要 的 基本 操作 的 较 低层 次 的 语言 ， 而 要 求 其 系统 软 
件 生 成 使 用 其 他 高 层次 语言 编写 程序 的 接口 。 . 

一 种 语言 的 实现 系统 并 不 是 一 台 计 算 机 上 的 唯一 软件 。 它 还 需要 一 个 称 为 操作 系统 的 大 程 
序 集 ， 这 个 程序 集 提供 高 于 机 器 语言 层次 的 基本 操作 。 这 些 基本 操作 包括 系统 资源 的 管理 、 输 
入 和 输出 操作 、 文 件 管理 系统 、 文 字 以 及 /或 者 程序 编辑 器 ， 还 包括 其 他 各 种 普遍 需要 的 功能 。 
因为 语言 的 实现 系统 需要 许多 操作 系统 工具 ， 所 以 实现 系统 是 与 操作 系统 接口 ， 而 不 是 (用 机 
器 语言 ) 直接 与 处 理 器 打交道 。 

操作 系统 和 语言 实现 系统 被 分 层 放置 于 计算 机 的 机 器 语言 接口 之 上 。 可 以 将 这 些 层次 设想 
为 虚拟 计算 机 ， 这 个 计算 机 在 高 层次 上 给 用 户 提供 使 用 接口 。 例 如 ， 一 个 操作 系统 和 一 个 C 程 
序 编 译 器 就 是 一 个 虚拟 的 C 计 算 机 。 借 助 于 其 他 编译 器 ， 一 个 机 器 能 变 成 其 他 类 型 的 虚拟 计算 
机 。 绝 大 多 数 的 计算 机 系统 都 提供 几 种 不 同类 型 的 虚拟 计算 机 。 用 户 程序 在 这 个 虚拟 计算 机 的 
顶端 层次 上 形成 另 一 个 层次 。 图 1-2 显 示 了 这 种 计算 机 的 分 层 概 念 。 

在 20 世 纪 50 年 代 后 期 创建 的 第 一 种 高 级 程序 设计 语言 的 实现 系统 ， 当 时 属于 最 复杂 的 软件 
系统 。 在 20 世 纪 60 年 代 ， 人 们 进行 了 大 量 深 入 的 研究 工作 ， 以 理解 构造 高 级 语言 实现 系统 的 过 


程 ， 并 将 这 一 过 程 形式 化 。 当 时 这 些 工作 中 最 成 功 的 部 分 是 在 语法 分 析 领 域 。 这 主要 是 因为 这 


一 部 分 的 实现 过 程 是 已 经 理解 了 的 自动 机 理论 和 形式 语言 理论 的 部 分 应 用 。 
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虚拟 C++ 计算 机 








虚拟 Scheme 计算 机 








C++ 编译 器 
虚拟 C 计 算 机 


虚拟 Java 计 算 机 虚拟 汇编 语言 计算 机 


虚拟 Ada 计 算 机 
图 1-2 一 台 典 型 的 计算 机 系统 所 提供 的 虚拟 计算 机 的 分 层 接口 
1.7.1 编译 


实现 程序 设计 语言 的 方法 可 以 是 三 种 一 般 方法 中 的 任何 一 种 。 一 个 极端 方面 是 ， 可 以 将 程 
序 翻 译 成 能 够 在 计算 机 上 直接 运行 的 机 器 语言 ， 这 种 方法 被 称 为 编译 器 实现 。 这 种 方法 的 优越 
性 是 ,一旦 完成 翻译 过 程 ， 程 序 执行 速度 非常 快 。 大 多 数 程序 设计 语言 (如 C、COBOL 和 Ada) 


的 实际 实现 都 是 借助 于 编译 器 的 。 
位 绝 译 绢 翻译 的 语言 称 为 源 语言 。 编 译 的 过 程 以 及 程序 的 执行 跨越 了 几 个 阶段 ， 图 1-3 显 示 
了 其 中 最 重要 的 几 个 阶段 。 


词法 分 析 器 将 源 程序 中 的 字符 集合 起 来 组 成 词法 单元 。 程 序 中 的 词法 单元 有 识别 符 、 特 殊 
字 、 运 算 符 和 标点 符号 。 词 法 分 析 器 将 忽略 源 程序 中 的 注释 部 分 ， 因 为 这 些 部 分 对 于 编译 器 没 
有 使 用 价值 。 

语法 分 析 器 从 词法 分 析 器 中 取出 词法 单元 ， 并 使 用 这 些 词法 单元 构造 一 种 被 称 为 语法 分 析 
树 (parse tree) 的 层次 结构 。 这 种 语法 分 析 树 代表 了 程序 中 的 语法 结构 。 在 许多 情况 下 ， 并 没 
有 真正 构成 语法 分 析 树 的 实际 结构 ， 而 只 是 直接 产生 和 利用 了 这 些 建立 语法 分 析 树 所 必需 的 信 
妃 。 词 法 单元 和 语法 分 析 树 将 在 第 3 章 中 作 进 一 步 的 讨论 ， 而 词法 分 析 和 语法 分 析 则 将 在 第 4 音 
中 进行 讨论 。 

中 间 代码 生成 器 产生 一 个 在 不 同 语言 中 的 程序 ， 这 种 程序 介 于 源 程序 和 编译 器 最 后 输出 的 
机 器 语言 程序 之 间 ”。 中 间 语 言 看 起 来 往往 很 像 汇编 语言 ， 而 事实 上 有 时 真 的 就 是 汇编 语言 ， 
在 其 他 一 些 情况 下 ， 中 间 代 码 处 于 略微 高 于 汇编 语言 的 层次 上 。 语 义 分 析 器 是 中 间 代 码 生 成 器 
的 一 个 组 成 部 分 。 语 义 分 析 器 将 检测 在 语法 分 析 过 程 中 难以 发 现 的 错误 ， 如 类 型 错误 。 


日 ”注意 ,程序 与 代码 两 个 词 经 常 交替 地 使 用 。 








结果 
图 1-3 编译 过 程 


优化 通过 使 程序 更 加 精炼 或 快速 或 皆 而 有 之 ， 达 到 改进 程序 (通常 是 在 程序 的 中 间 代码 版 
本 之 上 ) 的 目的 。 优 化 常常 是 编译 的 一 个 可 选 部 分 。 事 实 上 ， 一 些 编译 器 不 能 实行 任何 重要 的 
优化 。 这 类 编译 器 适用 于 程序 的 编译 速度 远 比 翻译 后 程序 的 执行 速度 更 为 重要 的 情形 ， 这 种 情 
形 的 一 个 例子 是 初学 程序 人 员 的 计算 实验 室 。 大 多 数 商务 和 工业 生产 的 情形 中 ， 程 序 的 执行 速 
度 远 比 其 编译 速度 更 为 重要 ， 因 而 普遍 需要 优化 。 又 由 于 许多 类 型 的 优化 难于 在 机 器 语言 上 实 
现 ， 因 而 绝 大 多 数 的 优化 是 在 中 间 代 码 上 完成 的 。 

代码 生成 器 将 程序 优化 后 的 中 间 代 码 版 本 翻译 为 相应 的 机 器 语言 程序 。 

符号 表 被 用 作 编译 过 程 的 数据 库 。 符 号 表 的 主要 内 容 是 程序 中 用 户 定义 的 名 字 的 类 型 和 属 
性 信息 。 这 些 信 息 由 词法 分 析 器 和 语法 分 析 器 放置 于 符号 表 中 ， 以 供 语义 分 析 器 和 代码 生成 器 
使 用 。 

如 前 所 述 ， 尽 管 由 编译 器 产生 的 机 器 语言 能 够 直接 在 硬件 上 运行 ， 但 同时 ， 这 些 机 器 语言 
几乎 必须 与 一 些 其 他 代码 一 起 运行 。 大 多 数 的 用 户 程序 还 需要 来 自 操 作 系统 的 程序 ， 其 中 最 常 
用 的 是 用 于 输入 和 输出 的 程序 。 用 户 程序 需要 这 些 程序 时 ， 编 译 器 就 产生 对 于 所 需要 的 系统 程 
序 的 调用 。 在 编译 器 所 产生 的 机 器 语言 程序 被 执行 之 前 ， 必 须 找 到 所 需要 的 操作 系统 程序 ， 并 
将 它们 与 用 户 程序 连接 起 来 。 这 是 通过 将 系统 程序 的 入 口 地 址 放置 到 用 户 程序 中 对 其 调用 的 位 
置 ， 而 将 用 户 程序 与 系统 程序 连接 起 来 。 这 样 连接 起 来 的 用 户 程序 和 系统 程序 ， 有 时 被 统称 为 
装载 模块 或 可 执行 镜像 。 这 种 收集 系统 程序 并 将 它们 与 用 户 程序 相连 接 的 过 程 被 称 为 链接 与 装 
载 ， 或 有 时 仅 称 为 链接 。 这 样 的 过 程 是 由 被 称 为 链接 器 的 系统 程序 来 完成 的 。 

除了 系统 程序 以 外 ， 用 户 程序 还 必须 时 常 与 已 编译 过 的 、 放 置 于 程序 库 中 的 其 他 用 户 程序 
链接 。 这 样 链 接 器 的 任务 就 不 仅仅 是 将 一 个 给 定 的 程序 与 系统 程序 相 链 接 ， 它 还 要 将 这 个 程序 


29 
30 


20 plp 


与 其 他 的 用 户 程序 相 链接 。 

一 台 计 算 机 的 存储 器 与 它 的 处 理 器 之 间 的 链接 速度 通常 决定 着 这 人 台 计 算 机 的 速度 ， 因 为 执 
行 指令 的 速度 往往 比 将 指令 传递 到 处 理 器 的 速度 更 快 ， 这 一 问题 被 称 为 汉 “，。 诺 依 曼 瓶 颈 ， 它 是 
区 详 依 曼 体系 结构 计算 机 速度 的 主要 限制 因素 。 解 决 办 诺 依 曼 瓶 颈 是 并 行 计算 机 研究 和 发 
展 的 一 个 主要 动机 。 he 


1.7.2 单纯 解释 


单纯 解释 在 实现 方法 中 正好 是 与 编译 相反 的 另 一 个 极端 。 使 
用 单纯 解释 的 方法 ， 程 序 不 需要 经 过 任何 翻译 过 程 ， 而 是 由 另 一 
个 被 称 作 解 释 器 的 程序 来 解释 执行 。 解 释 器 的 作用 就 如 同一 个 机 
器 的 软件 模拟 ， 它 的 取 指 -执行 周期 的 对 象 是 高 级 语言 中 的 程序 
语句 而 非 机 器 指令 。 这 种 软件 模拟 显然 给 程序 设计 语言 提供 了 一 
个 虚拟 机 器 。 

单纯 解释 技术 的 优越 性 是 ， 它 能 够 允许 容易 地 实现 在 许多 源 二 
程序 层次 上 的 调试 操作 ， 这 是 因为 运行 时 的 所 有 出 错 消 息 能 够 指 f 
向 出 错 的 源 程序 中 的 单元 。 例 如 当 发 现 一 个 数组 的 下 标 越界 时 ， 
出 错 消 息 能 够 很 容易 地 指出 源 程序 里 错误 所 在 的 行 以 及 数组 的 名 
称 。 但 另 一 方面 ， 这 个 方法 存在 着 严重 的 缺陷 ， 程 序 执行 的 速度 
要 比 编译 过 的 系统 速度 慢 10~ 100 倍 。 其 速度 缓慢 的 主要 原因 是 对 
高 级 语言 中 语句 的 解码 过 程 ， 这 种 解码 过 程 远 比 机 器 语言 指令 的 a 
解码 过 程 复杂 得 多 (尽管 使 用 高 级 语言 的 语句 可 能 会 比 功能 相同 : 
的 机 器 码 的 指令 数目 少 )。 更 有 其 者 , 一 条 语句 无 论 被 执行 多 少 次 ， 词法 单元 
对 它 的 每 一 次 执行 都 必须 解码 ， 因 而 语句 的 解码 (而 非 处 理 器 与 
存储 器 之 间 的 连接 ) 是 单纯 解释 方法 的 瓶颈 。 

单纯 解释 的 另 一 个 缺点 是 它 常常 需要 较 多 的 存储 空间 。 除 了 
源 程序 之 外 ， 符 号 表 在 解释 过 程 中 也 必须 出 现 。 此 外 ， 源 程序 的 





源 程序 







输入 数据 


语法 分 析 树 


存储 形式 是 为 了 方便 存 取 和 修改 而 设计 的 ， 而 不 是 为 了 占用 最 小 中 间 代 码 生 
的 存储 空间 。 成 器 
尽管 20 世 纪 60 年 代 的 一 些 简单 的 早期 语言 (AAPL, 中 间 代码 


解释 在 万 维 网 的 一 些 脚本 语言 上 又 大 量 使 用 ， 例 如 在 如 今 广 为 应 
用 的 JavaScript 和 PHP 上 。 图 1-4 所 示 为 单纯 解释 的 过 程 。 


1.7.3 混合 实现 系统 


一 些 程序 设计 语言 的 实现 系统 介 于 编译 器 与 单纯 解释 器 之 间 。 ”图 1-5 混合 实现 系统 
这 类 系统 将 高 级 语言 的 程序 翻译 成 一 种 专 为 方便 解释 而 设计 的 中 间 语言 。 因 为 只 需要 对 源 程序 语言 
中 的 语句 解码 一 次 ， 所 以 这 种 方法 比 单纯 解释 要 快 。 这 样 的 语言 实现 系统 就 被 称 为 混合 实现 系统 。 

图 1-5 所 示 是 一 种 用 于 混合 实现 系统 中 的 过 程 。 这 个 系统 仅仅 是 解释 中 间 语 言 代码 ， 而 不 是 
将 中 间 代 码 翻 译 成 机 器 码 。 

Perl 语 言 通过 一 个 混合 实现 系统 实现 。Perl 的 程序 被 部 分 地 编译 ， 以 便于 在 解释 执行 之 前 发 


SNOBOL 以 及 LISP 语 言 ) 是 单纯 解释 性 的 语言 ， 但 到 了 20 世 纪 80 (一 和 输入 数据 
年 代 ， 这 种 方式 已 经 很 少 在 高 级 语言 上 使 用 。 然 而 近年 来 ， 单 纯 解释 器 
结果 
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现 错误 ， 并 且 使 得 解释 器 简单 化 。 


Java 语 言 的 最 初 实现 都 是 采用 混合 方法 。 其 中 被 称 为 字 节 码 的 中 间 形 式 给 任何 装 有 字 蔬 码 


解释 器 以 及 与 之 相关 的 运行 时 系统 的 机 器 提供 了 可 移植 性 。 所 有 这 样 的 机 器 都 被 统称 为 Java 虚 
拟 机 。 而 现在 有 些 系统 将 Java 的 字 节 码 翻 译 成 机 器 码 ， 以 便 达 到 较 快 的 执行 速度 。 

即时 (Just-in-Time, JIT) 实现 系统 最 初 将 程序 翻译 成 为 一 种 中 间 语 言 。 然 后 在 执行 的 过 程 
中 ， 当 中 间 语 言 的 方法 被 调用 时 ， 这 种 实现 系统 再 将 中 间 语 言 的 方法 编译 成 为 机 器 代码 。 现 在 
JIT 实 现 系统 被 广泛 用 于 Java 程序 。 所 有 的 .NET 语言 也 都 是 用 JIT 系 统 实 现 的 。 

有 些 时 候 ， 实 现 程序 可 以 给 同一 种 语言 同时 提供 编译 和 解释 两 种 实现 方法 。 在 这 些 情况 下 ， 
解释 器 被 用 来 开发 和 调试 程序 。 当 达到 无 错 状态 (相对 而 言 ) 之 后 ， 再 编译 程序 ， 以 便于 提高 
执行 的 速度 。 

1.7.4 MANEJ 
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入 程序 中 。 归 根 到 底 ， 预 处 理 器 是 一 个 宏 指 令 扩展 器 。 预 处 理 器 的 指令 通常 被 用 来 说 明 程序 所 
应 该 包括 的 、 来 自 于 其 他 文件 的 代码 。 例 如 下 面 这 条 C 语言 预 处 理 器 指令 用 于 将 myLib.c 中 的 
内 容 复 制 到 程序 中 #include 所 在 的 位 置 : 

#include myLib.c 

另外 一 些 预 处 理 器 指令 被 用 来 定义 表达 式 中 的 符号 。 例 如 我 们 可 以 使 用 下 面 的 指令 来 
确定 两 个 给 定 表 达 式 之 中 数值 最 大 的 一 个 : 


#define max(A, B) ((A) > (B) ? (A) : (B)) 
例如 表达 式 
x Bmax(2 * y, z2 / 733 
通过 预 处 理 如 就 可 以 被 扩展 为 : 
x= ((2 * YS (Zz / tetas & 42 * Vr 3 {2 7 1.73); 


请 注意 ， 这 就 是 一 个 表达 式 的 副作用 会 引起 麻烦 的 例子 。 例 如 ， 如 果 这 两 条 赋予 宏 指 令 max 的 
表达 式 之 一 具有 如 z++ 之 类 的 副作用 ， 就 会 引起 问题 。 因 为 这 两 条 表达 式 中 的 一 个 参数 被 计算 
了 两 次 ， 经 由 宏 指 令 扩 展 所 产生 的 代码 导致 z 增 值 两 次 。 


1.8 程序 设计 环境 


程序 设计 环境 是 指 一 系列 在 软件 开发 过 程 中 所 使 用 的 工具 。 这 大 ,工具 可 能 只 包括 了 一 个 文 
件 系 统 、 一 个 文本 编辑 器 、 一 个 链接 器 以 及 一 个 编译 器 。 或 者 ， 它 也 可 能 包括 经 由 一 个 统一 的 
用 户 界 面 来 调用 的 一 系列 集成 工具 。 后 面 的 这 种 情形 极 大 地 提高 了 软件 开发 和 维护 的 效率 。 因 
而 一 种 程序 设计 语言 的 特征 不 是 一 个 系统 的 软件 开发 能 力 的 惟一 衡量 标准 。 我 们 现在 简略 地 描 
述 几 种 程序 设计 的 环境 。 

UNIX 系 统 是 一 种 比较 老 的 程序 设计 环境 ， 它 首次 发 布 于 20 世 纪 70 年 代 中 期 , 是 围绕 一 种 可 
移植 的 多 道 程序 设计 操作 系统 建造 的 。UNIX 系统 给 各 种 语言 的 软件 开发 与 软件 维护 提供 了 广 
省 的 强 有 力 的 支持 工具 。 过 去 UNIX 系统 所 缺乏 的 最 重要 特性 是 这 些 支持 工具 的 统一 界面 ， 正 
是 这 种 欠缺 ， 使 得 人 们 较 难 掌握 和 运用 UNIX 系统 。 然 而 现在 的 UNIX 系统 常常 是 通过 运行 于 
UNIX 系统 顶层 的 一 个 图 形 用 户 界面 (GUD) 来 使 用 。UNIX 图 形 用 户 界面 包括 Solaris 通 用 桌面 环 
境 (Solaris Common Desktop Environment，CDE)，GNOME 以 及 KDE。 这 些 图 形 用 户 界 面 使 得 
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UNIX 系 统 的 界面 形式 就 与 Windows 以 及 Macintosh 系统 的 用 户 界面 相 类 似 ， 

Borland JBuilder 是 一 种 程序 设计 环境 ， 它 提供 用 于 Java 开 发 的 一 个 集 编译 器 、 编 辑 器 、 调 
试 顷 和 文件 系统 于 一 体 的 组 合 ， 而 这 四 个 组 成 部 分 的 调用 都 是 经 过 一 个 图 形 界面 。JBuilder 是 一 
个 创建 Java 软 件 的 复杂 而 又 功能 俱全 的 系统 。 

软件 开发 环境 发 展 中 的 最 新 进展 以 微软 的 Visual Studio NETH AR, 这 是 一 组 大 量 而 精致 
的 软件 开发 工具 ， 全 部 通过 视窗 系统 界面 来 使 用 。 可 以 运用 这 个 系统 在 .NET 系列 的 五 种 语言 中 
挑选 任意 一 种 来 开发 软件 。 这 五 种 语言 是 : C#、Visual BASIC NET. JScript ali 
JavaScript 版 本 )、 天 # (微软 公司 的 Java 版 本 )、 或 者 受 控 的 C++。 


小 结 


学 习 程 序 设计 语言 具有 几 个 重要 的 理由 : 增强 编写 程序 时 运用 不 同 语言 结 二 构 的 能 力 ， 使 我 们 能 够 更 
为 明智 地 为 软件 项 目 选择 程序 设计 语言 ， 以 及 更 轻松 地 学 习 新 的 程序 设计 语言 。 
计算 机 已 被 广泛 用 于 解决 各 个 领域 中 的 各 种 问题 。 对 于 一 种 特殊 程序 设计 语言 的 设计 和 评估 ， 极 大 
地 取决 于 它 所 应 用 的 领域 。 
评 仿 程 序 设 计 语言 最 重要 的 标准 是 可 读 性 、 可 写 性 、 可 靠 性 和 总 体 代价 ， 这 些 将 成 为 我 们 审核 和 判 
断 本 书 讨论 的 各 种 语言 特性 的 基础 。 
影响 语言 设计 的 主要 因素 是 计算 机 体系 结构 和 软件 设计 方法 学 。 
设计 一 种 程序 设计 语言 主要 是 一 种 工程 技巧 ， 之 中 包括 语言 的 各 种 特性 、 结 构 与 功能 上 的 一 系列 权衡 。 
实现 程序 设计 语言 的 主要 方法 有 编译 、 单 纯 解 释 及 混合 实现 。 
程序 设计 的 环境 已 经 成 为 软件 开发 系统 的 重要 组 成 部 分 ， 而 其 中 程序 设计 语言 仅仅 只 是 一 个 部 分 。 
复习 题 
1. 为 什么 具有 一 些 语 言 设计 知 计 eile RUS REE 生计 语言 ? 
2. 为 什么 程序 设计 语言 特征 的 知识 会 使 整个 计算 机 界 受 
3. 在 过 去 45 年 中 ， 哪 一 种 程序 设计 语言 是 beater aa 
4. 在 过 去 45 年 中 ， 哪 一 种 程序 设计 语言 是 商务 应 用 领域 里 最 主要 的 应 用 语言 ? 
5. 在 过 去 45 年 中 ， 哪 一 种 程序 设计 语言 是 人 工 智能 领域 里 最 主要 的 应 用 语言 ? 
6. UNIX 系统 是 用 哪 一 种 语言 编写 的 ? 
7. 一 种 程序 设计 语言 具有 太 多 的 特性 有 什么 缺点 ? 
8. 为 什么 用 户 定义 的 操作 符 重 载 会 损害 程序 的 可 读 性 ? 
9. 能 否 举 出 一 个 在 C 设计 中 缺乏 正 交 性 的 例子 ? 
10. 哪 一 种 程序 设计 语言 将 正 交 性 作为 一 个 主要 的 设计 准则 ? 
11. 哪 一 种 基本 控制 语句 被 用 来 在 缺乏 控制 语句 的 语言 中 创建 比较 复杂 的 控制 语句 ? 
12. 程序 设计 语言 中 的 哪 一 种 构造 提供 了 过 程 抽象 ? 
13. 一 条 程序 是 可 靠 的 ， 意 味 着 什么 ? 
14. 为 什么 子 程序 参数 的 类 型 检测 很 重要 ? 
15. 什么 是 别名 使 用 ? 
16. 什么 是 异常 处 理 ? 
17. 为 什么 可 读 性 对 于 可 写 性 很 重要 ? 
18. 特定 语言 编译 器 的 代价 与 这 种 语言 的 设计 有 什么 关系 ? 
19. 在 过 去 的 45 年 中 ， 影 响 程序 设计 语言 设计 的 最 强烈 因素 是 什么 ? 
20. 其 语言 结构 取决 于 冯 : 诺 依 曼 计算 机 体系 结 才 构 的 是 什么 类 型 的 程序 设计 语言 ? 请 给 出 类 型 名 。 
“1.20 世 纪 70 年 代 软 件 开发 研究 的 结果 ， 发 现 了 哪 两 种 程序 设计 语言 的 缺陷 ? 
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22. 面向 对 象 的 程序 设计 语言 有 哪 三 个 基本 特性 ? 

23. 支持 面向 对 象 程序 设计 语言 三 个 基本 特性 的 第 一 种 语言 是 哪 种 语言 ? 35 | 
24. 给 出 一 个 例子 ， 说 明 两 个 语言 设计 标准 是 相互 矛盾 的 。 

25. 实现 一 种 程序 设计 语言 有 哪 三 种 一 般 方法 ? 

26. 哪 一 种 方法 能 产生 较 快 的 程序 执行 ， 是 编译 器 、 还 是 单纯 解释 器 ? 

27. 符号 表 在 编译 器 中 起 什么 作用 ? 

28. 链接 器 做 什么 工作 ? 

29.7, 诺 依 曼 瓶颈 的 重要 性 是 什么 ? 

30. 用 单纯 解释 器 来 实现 一 种 语言 的 优点 是 什么 ? 


练习 题 


.你 相信 人 们 抽象 思维 的 能 力 受 人 们 的 语言 能 力 的 影响 吗 ? 给 出 理由 来 支持 你 的 观点 。 
.就 你 所 知道 的 程序 设计 语言 中 ， 哪 些 语言 特性 的 合理 性 使 你 无 法 理解 ? 
如 果 要 支持 所 有 的 程序 设计 领域 ， 仅 使 用 一 种 语言 ， 你 的 论据 是 什么 ? 
如 果 要 反对 所 有 的 程序 设计 领域 ， 仅 使 用 一 种 语言 ， 你 的 论据 是 什么 ? 
除了 本 章 中 讨论 过 的 准则 之 外 ， 命 名 并 解释 另外 一 种 能 够 用 来 判断 程序 设计 语言 的 准则 。 
依 你 之 见 ， 常 用 程序 设计 语言 中 的 哪 种 语句 对 可 读 性 是 最 有 危害 的 ? 
Java 使 用 右 括号 来 标志 所 有 复合 语句 的 结束 。 你 支持 或 者 反对 这 种 设计 的 论点 是 什么 ? 
许多 语言 在 用 户 定义 的 名 字 中 区 别 大 小 写字 母 。 你 支持 或 者 反对 这 种 设计 决策 的 论点 是 什么 ? 
解释 程序 设计 语言 代价 的 不 同方 面 。 
10. 为 什么 即使 硬件 已 经 相对 的 便宜 ， 也 要 编写 高 效率 的 程序 ? 给 出 你 的 论点 。 
11. 就 你 所 知道 的 一 些 程序 设计 语言 ， 描 述 效率 与 安全 之 间 的 设计 权衡 。 
12. 在 你 的 观点 中 ， 一 种 完美 的 程序 设计 语言 应 该 包括 哪些 主要 的 特性 ? 36| 
13. 你 所 学 习 的 第 一 种 高 级 语言 是 由 一 个 单纯 解释 器 、 一 个 混合 实现 系统 ， 还 是 由 一 个 编译 器 来 实现 的 ? 
(如 果 没 有 研究 过 ， 你 必然 不 会 知道 这 些 。) 
14. 就 一 些 你 曾经 使 用 过 的 程序 设计 环境 ， 描 述 它们 优点 与 缺点 。 
15. 说 明 简单 变量 的 类 型 声明 语句 如 何 影响 程序 设计 语言 的 可 读 性 ”设想 一 些 语言 不 需要 它们 。 
16. 运用 本 章 所 六 述 的 评估 标准 给 你 所 知道 的 一 些 程序 设计 语言 写 评估 。 
17. 一 些 程序 设计 语言 ， 例 如 Pascal， 用 分 号 来 分 隔 语句 ， 而 Java 则 用 分 号 来 结束 语句 。 依 你 所 见 ， 哪 一 种 
用 法 最 自然 ， 并 且 不 会 造成 语法 错误 ? 给 出 理由 。 
18. 有 些 现代 语言 允许 两 种 类 型 的 注释 ， 一 种 在 注释 行 的 两 端 使 用 间隔 符 ( 多 行 注释 )， 另 外 一 种 只 在 注释 
行 的 开头 使 用 间隔 标志 (单行 注释 )。 参 照 我 们 的 标准 ， 分 别 讨论 这 两 种 设计 选择 的 优点 和 缺点 。 37 | 
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第 2 章 主要 程序 设计 语言 的 发 展 


本 章 将 叙述 一 系列 程序 设计 语言 的 发 展 过 程 ， 还 要 探究 每 一 种 语言 的 设计 环境 ， 并 且 重 点 
介绍 各 种 语言 的 页 献 与 开发 动机 。 本 章 并 不 包括 对 这 些 程序 设计 语言 的 总 体 描述 ; 相反， 我 们 
只 讨论 每 种 语言 ?1 入 的 一 些 新 特性 。 我 们 尤其 感 兴趣 的 是 那些 对 后 来 的 程序 设计 语言 或 对 计算 
机 科学 领域 有 极 大 影响 的 特性 。 

本 佛 将 不 深 入 讨论 任何 语言 特性 或 者 概念 ， 我 们 将 这 样 的 讨论 留 到 后 面 的 章节 中 。 对 语言 
特性 非 形 式 化 的 简略 解释 就 足以 帮助 我 们 理解 这 些 语言 的 发 展 过 程 。 

本 章 将 讨论 许多 读者 都 不 熟悉 的 不 同 的 语言 和 语言 原理 。 而 且 ， 在 后 续 的 章节 中 将 详细 讲 
解 相 关 主 题 。 读 者 在 本 章 遇 到 的 悬而未决 的 问题 只 有 在 本 书 的 后 面 章 节 中 才能 解决 。 

在 这 里 选择 哪些 语言 进行 讨论 是 基于 作者 的 观点 ， 许 多 读者 可 能 会 不 高 兴 他 们 所 喜欢 的 一 
种 或 多 种 语言 未 被 包括 其 中 。 然 而 ， 为 了 保持 合理 的 篇 幅 ， 我 们 必须 舍弃 一 些 被 人 们 推崇 的 语 
言 ， 这 种 选择 是 基于 我 们 对 每 种 语言 在 程序 设计 语言 的 发 展 及 其 对 整个 计算 机 世界 的 重要 性 的 
佑 价 。 我 们 还 将 简略 地 讨论 一 些 在 本 书 的 后 面 几 章 将 要 引用 的 其 他 语言 。 

本 章 按 如 下 方式 组 织 : 按照 年 代 的 顺序 一 般 性 地 讨论 语言 的 最 初版 本 。 然 而 ， 语 言 的 后 续 
版 本 也 和 最 初版 本 一 起 列 出 ， 后 不 放 在 后 面 章 节 中 。 例 如 ，Fortran 2003 在 Fortran I (1956) 一 节 
中 讨论 。 当 然 ， 在 某 些 情况 下 ， 与 一 些 语 言 联系 不 那么 紧密 的 语言 放 在 它们 自己 的 小 节 中 介绍 。 

本 章 包括 14 个 完整 的 示例 程序 ， 每 个 程序 使 用 一 种 不 同 的 程序 设计 语言 。 但 本 章 并 不 对 这 
些 程 序 进行 描述 ， 仅 仅 是 举例 说 明 程 序 在 这 些 语言 中 的 外 观 。 除 了 LISP、COBOL 和 Smalltalk 
语言 的 程序 以 外 (关于 LISP 程 序 的 例子 ， 将 在 第 15 章 讨论 )， 任 何 熟 悉 常 用 命令 式 语言 的 读者 
都 应 该 能 够 阅读 和 理解 本 章程 序 中 的 大 部 分 代码 。 这 一 章 中 的 Fortran, ALGOL 60, PL/I, 
BASIC, Pascal, C, Perl, Ada, Java, JavaScript 以 及 C# 程序 ， 都 用 于 解决 同一 个 问题 。 请 注 
意 ， 上 面 绝 大 多 数 现代 语言 都 支持 动态 数组 ， 但 因为 示例 问题 的 简单 性 ， 我 们 没有 在 这 些 示例 
程序 中 运用 动态 数组 。 另 外 ， 在 Fortran 95 的 程序 中 ， 我 们 没有 使 用 那些 可 以 用 以 避免 循环 的 特 
性 ， 部 分 原因 是 为 了 保持 程序 的 简单 、 可 读 性 ， 而 另外 的 原因 仅仅 是 为 了 介绍 这 种 语言 中 的 基 
本 循环 结构 。 

图 2-1 古 本 章 所 讨论 的 高 级 语言 的 一 个 概貌 。 


2.1 Zuse 的 Plankalkul 语 言 
这 一 章 讨论 的 第 一 种 程序 设计 语言 在 几 个 方面 都 极 不 寻常 。 首 先 ， 它 从 来 没有 被 实现 过 ， 


其 次 ， 尽 管 它 于 1945 年 开发 ， 但 关于 它 的 描述 直到 1972 年 才 发 表 。 由 于 极 少 有 人 熟悉 这 种 语言 ， 
所 以 直到 这 种 语言 开发 完成 15 年 之 后 ， 它 的 一 些 功 能 才 出 现 于 其 他 程序 设计 语言 之 中 。 


2.1.1 历史 背景 


1936 年 至 1945 年 间 ， 德 国 科学 家 Konrad Zuse (发 音 为 “Tsoo-zuh”) 用 电子 机 械 继电器 制 
霹 了 一 系列 复杂 的 计算 机 。 到 了 1945 年 初 ， 战 争 几 乎 毁坏 了 他 所 有 的 最 新 计算 机 模型 ， 只 有 Z4 
便 型 幸存 下 来 ， 他 因此 搬 到 了 一 个 称 为 Hinterstein 的 遥远 的 巴伐利亚 村 庄 ， 而 他 的 研究 小 组 成 
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员 也 都 各 奔 前 程 。 
Zuse 独 自 工作 着 ， 他 着 手 开发 一 种 用 来 表达 计算 的 语言 ， 这 是 开始 于 1943 年 、 作 为 他 的 博 


士 论文 计划 的 一 个 项 目 。 他 将 这 种 语言 命名 为 Plankalkiil， 意 为 “程序 微 积分 学 ” 。 在 一 份 很 长 
的 、 落 款 日 期 为 1945 年 但 直到 1972 年 才 发 表 的 手稿 中 (Zuse, 1972), Zuse 定义 了 Plankalkiil 语 
言 ， 并 且 使 用 这 种 语言 为 各 种 问题 编写 了 算法 。 

1957 Fortran| —— FLOW-MATIC 


58 Fortran ll 一 一- ALGOL 58 
59 LISP 


60 ALGOL 60 @ APL COBOL 





62 Fortran IV —> 
SNOBOL 


73 Prolog e 





MODULA-2 
78 Fortran 77 "= 


Miranda! CON 
o 
COMMISN LISP 


88 MODULA- Oberon e Haskell 


ANSI C (C89) 
90 Fortran 90 —> 
Python 


95 Fortran 95_» 
97 Javascript 


99 C99 
00 CH 
01 Visual Basic.NET 


03 Fortran 2003 N 
04 Java 5.0 


2.1.2 语言 概述 


Plankalkiil 语言 怀 人 地 完整 ， 并 在 数据 结构 方面 具有 一 些 最 先进 的 特性 。Plankalkiil 中 最 简 
单 的 数据 类 型 是 单个 字 位 类 型 ， 从 字 位 类 型 构造 出 整数 与 浮 点 数值 类 型 。 浮 点 类 型 使 用 了 两 两 
互补 的 标记 法 以 及 “隐蔽 字 位 ”方案 ， 现 在 人 们 使 用 这 种 方案 来 避免 存储 一 个 数值 的 标准 化 小 
数 部 分 的 最 高 字 位 。 

除了 这 些 贡 用 的 标量 类 型 ，Plankalkiil 语 言 还 包括 了 数组 和 记录 。 这 种 记录 又 可 以 包括 嵌 套 
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的 记录 。 

尽管 这 种 语言 没有 显 性 goto 语 句 ， 但 它 确 实 包 括 了 一 个 类 似 于 Ada 语 言 的 foz 语 名 的 迭代 语 
句 。 它 还 有 一 个 带 有 上 标的 Fin 命 令 ， 上 标的 值 指示 跳出 特定 数目 的 嵌 套 和 迭代， 或 者 跳 到 一 个 新 
运 代 周期 的 开始 位 置 。Plankalki 语 言 还 包括 了 一 条 选择 语句 ， 但 它 不 允许 使 用 else 子 铝 . 

Zuse 的 程序 中 最 有 趣 的 特性 之 一 是 用 数学 表达 式 来 表示 程序 变量 之 间 的 关系 。 这 些 表达 式 
声明 ， 在 代码 执行 中 它们 出 现 的 地 方 什么 条 件 为 真 。 这 非常 类 似 于 今天 在 Eiffel 程序 设计 语言 
(Meyer，1992) 和 公理 语义 中 使 用 的 断言 。Eiffel 程序 设计 语言 以 及 公理 语义 将 在 第 3 章 讨论 。 

2use 的 手稿 包含 了 远 比 在 1945 年 之 前 编写 的 任何 程序 都 更 复杂 的 程序 。 这 些 程序 包括 数值 
数组 排序 程序 、 测 试图 连接 性 的 程序 、 执 行 整数 和 浮 点 运算 (包括 计算 平方 根 ) 的 程序 ， 并 日 
还 有 对 含有 六 个 不 同 优先 级 的 括号 和 运算 符 的 逻辑 公式 进行 语法 分 析 的 程序 。 也 许 最 令 人 惊异 
的 是 他 长 达 49 页 的 国际 象棋 算法 ， 尽 管 他 并 不 是 国际 象棋 游戏 的 专家 。 

如 采 在 20 世 纪 50 年 代 初 ， 有 一 位 计算 机 科学 家 发 现 了 Zuse 关于 Plankalkiil 语 言 的 描述 ， 能 
够 妨碍 这 位 科学 家 依照 该 语言 的 定义 来 实现 这 种 语言 的 唯一 因素 ， 只 能 是 Zuse 所 使 用 的 各 种 标 
记 法 。Plankalkiil 语 言 中 的 每 一 条 语句 由 2~3 行 代码 组 成 。 第 一 行 代码 最 像 目 前 同类 语言 使 用 的 
语句 ， 第 二 行 代码 是 可 选择 的 ， 其 中 包含 第 一 行 所 引用 的 数组 的 下 标 值 。 一 个 值得 注意 的 有 趣 
事实 是 ，19 世 纪 中 叶 的 Charles Babbage 在 为 他 的 分 析 引擎 (Analytical Engine) 编写 的 程序 中 使 
用 了 相同 的 方法 来 表示 下 标 。 在 每 一 条 Plankalkiil 语 名 的 最 后 一 行 ， 包 含 了 在 第 一 行 中 所 用 到 的 
变量 类 型 的 名 字 。 当 人 们 第 一 次 看 到 这 种 标记 法 时 会 相当 吃惊 。 

下 面 的 赋值 语句 示例 介绍 了 这 种 标记 方法 。 这 里 表示 ， 将 表达 式 A[4]+1 赋 值 给 AT5]， 其 
中 的 行 标 号 V 是 下 标的 数值 ， 而 行 标号 s 是 数据 类 型 。 这 个 例子 中 的 1 “n 表 示 一 个 n 字 位 的 整数 。 

| A+ 1 => 

v | 4 

S| l.n 

我 们 现在 只 能 猜想 ， 如 果 Zuse 的 工作 早 在 1945 年 或 者 即使 是 在 1950 年 就 广泛 地 为 人 们 知晓 ， 
那么 程序 设计 语言 该 会 向 什么 方向 发 展 。 再 猜想 下 ， 假 若 他 是 工作 于 和 平 的 环境 ， 有 其 他 科学 
家 的 帮助 ， 而 不 是 处 于 1945 年 的 德国 一 -在 那 种 与 世 隔 绝 的 环境 中 ， 那 么 他 工作 的 影响 力 又 是 
怎样 的 不 同 。 


2.2 最 小 硬件 的 程序 设计 : 伪 代 码 


目 先 ， 注意 这 里 使 用 到 的 伪 代 码 一 词 与 现在 一 般 意义 上 的 不 一 样 。 我 们 称 本 节 中 讨论 的 话 
言 为 伪 代 码 ， 是 因为 它们 在 开发 和 使 用 时 (20 世纪 40 年 代 末 到 20 世 纪 50 年 代 初 ) 被 命名 为 伪 代 
码 。 然 而 ， 在 当代 ， 它 们 已 不 再 是 伪 代 码 。 

20 芷 纪 40 年 代 后 期 至 50 年 代 初 期 的 计算 机 ， 远 没有 今天 的 计算 机 这 么 好 用 。 除 了 速度 慢 ， 
不 可 筷 、 价 格 昂 贵 和 极其 有 限 的 存储 空间 外 ， 那 个 时 代 的 计算 机 因为 缺少 支持 软件 ， 而 使 编程 
十 分 困难 。 

当时 没有 高 级 程序 设计 语言 ， 黄 至 没有 汇编 语言 ， 因 而 程序 设计 都 是 使 用 机 器 代码 来 完成 ， 
这 项 工作 真是 既 麻 烦 又 错误 百出 。 其 中 的 一 个 问题 是 要 使 用 数值 代码 来 说 明 指令 。 例 如 ， 用 数 
值 编 码 14 来 表示 ADD 指 令 ， 而 不 是 使 用 蕴涵 意义 的 文字 命名 ， 哪 怕 仅 仅 是 使 用 单个 字母 也 好 
这 使 得 程序 非常 难于 阅读 。 另 一 个 更 为 严重 的 问题 是 要 使 用 绝对 地 址 ， 这 使 得 程序 的 修改 非常 
困难 。 例 如 ， 假 设 我 们 有 一 个 存储 于 存储 器 中 的 机 器 语言 程序 ， 这 个 程序 中 的 许多 指令 都 指向 
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该 程序 中 的 其 他 位 置 ， 通 常 表示 引用 数据 或 者 说 明 分 支 指令 的 目标 。 在 程序 中 的 任何 位 置 ( 除 
了 在 程序 的 结尾 ) 插入 一 条 指令 ， 就 会 改变 指向 该 插入 地 址 之 后 的 所 有 指令 的 正确 性 。 因 为 为 
了 给 新 的 指令 让 出 位 置 ， 那 些 指令 的 地 址 都 必须 增加 。 要 正确 地 增加 这 些 地址 ， 必 须 找到 并 修 
改 所 有 指 站 这 些 地 址 的 、 在 新 增 指令 之 后 的 那些 指令 。 同 样 的 问题 也 发 生 在 删除 一 条 指令 的 时 
候 。 当 然 在 这 种 情况 下 ， 机 器 语言 通常 可 以 使 用 一 条 “无 操作 ”指令 来 替代 被 删除 的 指令 ， 以 
避免 这 种 类 型 的 问题 。 

这 皇 征 所 有 机 器 语言 的 典型 问题 ， 它 们 是 促使 人 们 发 明 汇 编 器 以 及 汇编 语言 的 主要 动力 . 
陈 此 以 外 ， 当 时 大 部 分 的 程序 设计 问题 是 需要 有 浮 点 数 的 算术 运算 ， 以 及 一 些 便于 数组 使 用 的 
下 标 索引 方法 。 然 而 这 些 功能 都 没有 带 进 20 世 纪 40 年 代 未 至 50 年 代 初期 的 计算 机 体系 结构 之 中 
这 些 缺 陷 自 然 地 导致 了 较 高 级 语言 的 发 展 。 


2.2.1 短 代 码 


第 一 种 被 称 为 短 代码 (Short Code) 的 新 语言 是 由 John Mauchly 于 1949 年 为 BINAC 计算 机 
开发 的 。 后 来 短 代码 被 植 移 到 一 台 UNIVAC I 计算 机 上 。 在 此 后 多 年 ， 这 种 语言 一 直 是 这 类 机 
三 上 程序 设计 的 主要 手段 。 尽 管 ， 因为 关于 原始 短 代码 的 完整 描述 从 来 没有 被 发 表 过 ， 人 们 对 
其 所 知 非常 有 限 ， 然 而 一 本 UNIVAC I 版 本 的 程序 设计 手册 却 被 保存 了 下 来 (Remington-Rand, 
1952) 。 我 们 可 以 比较 有 把 握 地 推断 ， 这 个 版 本 与 原始 短 代码 的 版 本 非常 相似 。 

UNIVAC I 存储 絮 的 字 具 有 72 个 字 位 ，。 这 72 个 字 位 被 组 合成 为 12 个 六 - 字 位 的 字 节 。 短 代码 
征 由 编 好 码 的、 将 被 求 值 的 数学 表达 式 组 成 的 。 这 些 代码 是 字 节 对 (byte-pair) 的 数值 形式 ， 
并 且 大 多 数 的 方程 适宜 被 包含 进 一 个 字 内 。 下 面 是 这 样 一 些 代 码 的 形式 ; 


01 - 06 abs value ln (n+2)nd power 
02 ) 07 + 2n (n+2)nd root 
03 = 08 pause 4n if <=n 

04 / 097; ( 58 print and tab 


变量 (或 者 是 存储 空间 的 地 址 ) 用 字 节 对 代码 来 命名 ， 存放 常量 的 地 址 也 是 以 这 种 方式 表 
示 。 例 如 ，X0 和 Y0 可 以 是 变量 。 语 句 

X0 = SQRT(ABS(Y0 ) ) 
可 以 编码 成 为 一 个 字 ， 如 00 X0 03 20 06 Y0。 起 始 代码 00 用 作 字 的 填充 码 。 有 趣 的 是 ， 
这 种 语言 没有 乘法 代码 ， 与 在 代数 中 一 样 ， 对 于 乘法 的 表示 是 将 两 个 操作 数 相 邻 放置 。 

短 代 码 不 翻译 成 机 器 码 ， 相 反 ， 它 由 单纯 解释 器 来 实现 。 当时 人 们 将 这 种 过 程 称 为 自动 程 
序 设计 。 它 显然 简化 了 程序 设计 的 过 程 ， 但 却 是 以 程序 的 执行 时 间作 为 代价 的 。 短 代码 的 解释 
过 程 大 约 比 机 器 代码 的 运行 要 慢 50 fe, 


2.2.2 快速 编码 


在 其 他 地 方 ， 开 发 解释 系统 是 为 了 使 其 能 包括 浮 点 数 的 操作 ， 从 而 扩展 机 器 语言 。John 
Backus 为 IBM 701 计 算 机 开发 的 快速 编码 (Speedcoding) 束 是 这 种 类 型 系统 的 一 个 例子 
(Backus，1954)。 这 个 快速 编码 解释 器 有 效 地 将 701 机 器 转换 成 为 一 个 具有 虚拟 的 三 地 址 浮 点 数 
的 计算 器 。 这 个 系统 包括 在 浮 点 数据 上 进行 四 种 算术 运算 的 虚拟 指令 ， 以 及 进行 平方 根 、 正 弦 、 
正切 、 指 数 和 对 数 等 运算 的 虚拟 指令 。 条 件 和 无 条 件 分 支 以 及 输入 /输出 的 转换 ， 也 是 该 虚拟 体 
系 结构 的 组 成 部 分 。 这 个 系统 的 局 限 性 可 以 用 一 种 情形 来 说 明 ， 这 个 系统 在 装载 了 解释 器 之 后 ， 


SU 


剩 祭 的 可 用 存储 空间 就 只 有 700 个 字 ， 并 且 运 行 一 条 ADD 指 令 就 要 耗费 4.2 毫 秒 。 另 一 方面 ， 快 
速 编 码 包 括 了 给 地 址 寄存 器 自动 增值 的 新 颖 机 制 。 而 直到 1962 年 ，UNIVAC 1107 计算 机 开发 之 
后 ， 相 类 似 的 机 制 才 在 硬件 中 出 现 。 因 为 快速 编码 的 这 种 自动 增值 的 特性 ， 甜 阵 乘 法 的 运算 可 
以 由 12 条 快速 编码 的 指令 来 完成 。Backus 曾 经 宣称 ， 在 机 器 码 中 要 花 两 个 星期 来 编程 的 这 类 问 
题 ， 使 用 快速 编码 可 以 在 几 个 小 时 之 内 完成 。 


2.2.3 UNIVAC “编译 ”系统 


1951 年 至 1953 年 之 间 ， 在 UNIVAC 公 司 ， 一 个 由 Grace Hopper 领 导 的 小 组 开发 了 一 系列 的 
“编译 ”系统 ， 被 命名 为 A-0、A-1 和 A-2。 这 些 系统 采用 了 如 同 将 宏 指令 扩展 成 汇编 语言 一 样 的 
方式 ， 将 伪 代 码 扩展 成 机 器 码 子 程序 。 作 为 这 些 “ 编 译 器 ” 源 代 码 的 伪 代 码 仍 是 相当 原始 的 ， 
但 采用 这 种 代码 使 得 源 程序 短 了 很 多 ， 所 以 相对 于 机 器 码 来 说 ， 这 已 经 是 一 个 巨大 的 进步 。 
Wilkes (1952) 也 独立 地 提出 了 一 个 相 类 似 的 过 程 。 | 


2.2.4 相关 的 工作 


大 约 就 在 同一 时 期 ， 用 以 减轻 程序 设计 工作 难度 的 其 他 方法 也 被 相继 开发 。 剑 桥 大 学 的 
David J. Wheeler 开 发 了 一 种 方法 ， 使 用 可 以 重新 定位 地 址 的 块 结构 来 部 分 地 解决 绝对 地 址 的 问 
题 (Wheeler，1950) 。 后 来 ，Maurice V. Wilkes (也 是 剑桥 大 学 的 ) 扩展 了 这 种 思路 来 设计 一 
种 汇编 程序 ， 这 种 程序 可 以 组 合 选择 的 子 程序 ， 并 分 配 存储 空间 (Wilkes 等 人 ，1951，1957)。 
这 的 确 是 一 个 重要 的 具有 里 程 碑 性 质 的 进步 。 

我 们 应 该 提 到 ， 汇 编 语言 是 于 20 世 纪 50 年 代 的 初期 发 展 起 来 的 ， 这 种 语言 与 上 述 的 伪 代 码 
相当 不 同 。 然 而 汇编 语言 对 于 高 级 语言 的 设计 基本 上 没有 产生 什么 影响 。 


2.3 IBM 704 计算 机 与 Fortran 


1954 年 IBM 704 计 算 机 的 问世 ， 训 无 疑问 是 计算 机 界 有 始 以 来 最 重大 的 进步 乙 一 。 最 主要 
的 原因 是 由 于 这 种 计算 机 的 功能 促进 了 Fortran 语 言 的 发 展 。 也 许 有 人 会 争辩 ， 假 者 没有 IBM 的 
704 计 算 机 和 Fortran 语 言 ， 不 久 也 会 有 其 他 的 公司 开发 出 类 似 的 计算 机 并 产生 与 其 相关 的 高 级 语 
言 。 然 而 ，IBM 却 是 第 一 个 兼 有 远见 与 资源 而 从 事 这 项 开发 的 公司 。 


2.3.1 历史 背景 


为 什么 从 20 世 纪 40 年 代 示 一 直到 50 年 代 的 中 期 ， 人 们 在 这 么 长 时 期 内 都 容忍 了 解释 系统 
E? 主要 的 原因 之 一 是 当时 的 计算 机 上 缺乏 浮 点 数 运算 的 硬件 ， 因 而 必须 使 用 软件 来 模拟 所 有 
浮 点 数 运算 ， 这 是 一 个 极为 耗 时 的 过 程 。 因 为 中 央 处 理 器 耗费 很 多 的 时 间 用 于 软件 的 浮 点 数 处 
理 过 程 ， 以 至 于 解释 过 程 以 及 检索 模拟 的 额外 开销 就 显得 相对 无 关 紧 要 了 。 只 要 是 浮 点 数 的 运 
算 必 须 由 软件 来 完成 ， 解 释 过 程 就 成 为 可 以 接受 的 代价 。 然 而 当时 有 许多 程序 人 员 从 不 使 用 解 
释 系 统 ， 而 宁可 采用 手工 编码 的 机 絮语 言 《或 汇编 语言 )。 在 硬件 上 兼 有 索引 检索 与 序 点 数 运 算 
指令 的 IBM 704 系统 的 诞生 ， 至 少 为 科学 计算 领域 预示 了 解释 器 时 代 的 结束 。 在 硬件 上 包含 浮 
点 数 运算 指令 ， 也 销 除 了 解释 器 带 来 的 开销 问题 。 

Fortran 通常 被 誉 为 第 一 种 编译 式 高 级 语言 ， 但 究竟 谁 应 该 获得 实现 第 一 种 这 类 语言 的 荣誉 
Alin Fc VS. Knuth 和 Pardo (1977) 将 这 个 殊荣 给 予 Alick E.Glennie， 因 为 他 在 Manchester 
Mark I 计算 机 上 构造 了 自动 编码 (Autocode) 编译 器 。Glennie 是 在 位 于 英国 的 Halstead 兵营 的 
星 家 军备 研究 所 (Royal Armaments Research Establishment) 开发 的 这 种 编译 器 。 这 个 编译 器 于 


1952 年 9 月 之 前 已 经 投入 使 用 。 然 而 根据 John Backus 的 观点 (Wexelblat，1981，p.26)， 他 认为 
Glennie 的 自动 编码 编译 器 是 在 很 低 的 层次 上 ， 并 且 是 面向 机 器 的 ， 因 而 不 应 该 认为 它 是 一 个 编 
译 系 统 。Backus 则 将 这 个 殊荣 给 予 麻 省 理工 学 院 (MIT) 的 Laning 和 Zierler。 

Laning 和 Zierler 的 系统 (Laning and Zierler, 1954) 是 实现 了 的 第 一 种 代数 翻译 系统 。 这 里 
代数 的 意思 是 指 它 能 够 翻译 算术 表达 式 ， 能 够 进行 数学 函数 的 调用 ， 并 且 还 包括 了 数组 。 这 个 
系统 首先 以 实验 样机 的 形式 于 1952 年 夏天 在 麻 省 理工 学 院 (MIT) 的 旋风 (Whirlwind) 计算 机 
上 实现 ， 并 于 1953 年 5 月 之 前 在 同一 机 器 上 完成 了 一 种 更 为 实用 的 实现 形式 。 这 个 翻译 器 对 程序 
中 的 每 一 个 计算 公式 或 每 一 条 计算 表达 式 产生 一 个 子 程序 的 调用 。 这 种 源 语 言 很 容易 阅读 ， 它 
包括 的 唯一 的 机 器 指令 是 分 支 指令 。 虽 然 这 项 工作 超前 于 Fortran， 但 是 却 从 来 没有 跨 出 过 麻 省 
理工 学 院 。 

尽管 有 这 些 较 早 期 的 工作 ，EFortran 仍 旧 是 第 一 种 为 人 们 广泛 接受 的 编译 式 高 级 程序 设计 语 
言 。 下 面 的 几 节 将 按 年 代 记 述 这 一 重要 的 发 展 。 


2.3.2 ”设计 过 程 


早 在 704 系 统 于 1954 年 5 月 被 推出 以 前 ，Fortran 语 言 的 计划 就 已 经 开始 了 。IBM 的 John 
Backus 和 他 的 工作 小 组 于 1954 年 11 月 之 前 发 表 了 题目 为 “FORTRAN: IBM 的 数学 模拟 翻译 系 
统 (The IBM Mathematical FORmula TRANslating System: FORTRAN)” 的 报告 (IBM, 1954), 
这 份 文件 摘 述 了 被 称 为 Fortran 0 的 Fortran 语言 实现 之 前 的 第 一 个 版 本 。 它 大 胆 地 声明 Fortran 将 
提供 与 手工 编码 程序 一 样 的 高 效率 ， 以 及 与 解释 式 伪 代码 系统 一 样 容易 的 程序 设计 。 过 于 乐观 
的 一 面 是 ， 这 个 文件 宣称 Fortran 将 会 消除 代码 中 的 错误 ， 并 能 够 免除 程序 调试 的 过 程 。 在 此 前 
提 下 ，Fortran 的 第 一 个 编译 器 几乎 没有 包括 语法 错误 的 检测 

当时 开发 Fortran 的 环境 有 下 列 特 点 : (1) 计算 机 仍然 是 小 型 、 速 度 慢 且 相对 不 可 靠 ，(2) 计 
算 机 的 主要 应 用 领域 是 科学 计算 ，(3) 不 存在 计算 机 编程 的 高 效率 方法 ，(4) 因为 计算 机 的 代价 
比 编程 人 员 的 代价 高 ， 因 而 第 一 代 Fortran 编 译 器 的 主要 目标 是 高 速度 的 目标 代码 。Fortran 语 言 
早期 版 本 的 特征 直接 与 当时 的 语言 设计 环境 相关 。 


2.3.3 Fortran | 概况 


Fortran 0 古 在 实现 期 间 被 修改 的 。 这 个 修改 过 程 从 1955 年 1 月 开始 ， 一 直 持 续 到 1957 年 4 月 
Fortran 编 译 避 被 推出 为 止 。 这 个 被 实现 了 的 语言 称 为 Fortran I。 在 1956 年 10 月 出 版 的 第 一 本 关于 
Fortran 语 言 的 Programmer’s Reference Manual (IBM, 1956) 对 Fortran I 进行 了 描述 。Fortran I 
包括 了 输入 /输出 格式 化 、 长 达 六 个 字符 的 变量 名 (在 Fortran 0 中 只 包括 有 两 个 字符 的 变量 名 )、 
用 户 定义 的 子 程序 (尽管 当时 的 子 程序 是 不 能 分 别 编译 的 )、IF 选择 语句 以 及 DO 循环 语句 。 

Fortran I 中 所 有 的 控制 语句 都 是 以 704 机 器 指令 为 基础 的 。 现 在 不 太 清 楚 ， 究 竟 是 704 机 器 
的 设计 人 员 支 配 了 Fortran I 控制 语句 的 设计 ， 还 是 704 机 器 的 设计 入 员 接 受 了 Fortran I 语言 的 设 
计 人 员 的 建议 ， 从 而 构造 这 些 机 器 指令 。 

Fortran I 语言 中 没有 数据 类 型 的 说 明 语 句 。 名 字 由 I、J、K、L、M 和 N 字 母 开 始 的 变量 被 瞳 
未 为 整数 类 型 ， 而 由 其 他 所 有 字母 开始 的 则 被 暗示 为 浮 点 数 类 型 。 这 种 字母 选择 的 约定 是 基于 
当时 的 使 用 习惯 ， 即 整数 主要 用 来 作为 下 标 ， 而 科学 人 员 通 常 使 用 i、j 和 k 作为 下 标 。 
Fortran 语言 的 设计 人 员 出 手 更 为 大 方 ， 比 这 种 通常 的 用 法 又 多 给 了 三 个 字母 。 

Fortran 语 言 开发 小 组 在 语言 的 设计 中 提出 的 最 大 胆 宣 称 是 ， 由 Fortran 编 译 器 产生 的 机 器 码 
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与 手工 编码 产生 的 代码 有 大 致 相同 的 效率 ”。 在 Fortran 语言 实际 推出 之 前 ， 这 个 宣称 使 得 潜在 
的 用 户 产生 很 大 疑虑 ， 并 且 大 大 降低 了 人 们 对 Fortran 原 有 的 兴趣 。 然 而 出 乎 人 们 意料 的 是 ， 
Fortran 开发 小 组 在 语言 的 效率 上 几乎 达到 了 它 声 称 的 目标 。 建 造 第 一 台 编 译 器 的 18 个 人 年 工作 
中 的 大 部 分 ， 是 用 于 编译 器 的 优化 上 ， 而 这 项 工作 的 结果 是 惊人 的 高 效率 。 

1958 年 4 月 所 做 的 调查 结果 显示 了 Fortran 语 言 的 初步 成 功 。 粗 略 来 说 ， 当 时 704 机 型 的 一 半 
程序 是 用 Fortran 语 言 编写 的 ， 尽 管 仅 在 一 年 之 前 ， 大 部 分 程序 设计 人 员 还 持 着 极端 怀疑 的 态度 。 


2.3.4 Fortran Il 概况 


1958 年 的 春天 发 布 了 Fortran I 编译 器 。 这 个 系统 对 Fortran I 编译 系统 中 的 许多 错误 都 进行 了 
修改 ， 并 且 给 Fortran 语 言 增加 了 一 些 重 要 的 特性 ， 其 中 最 重要 的 特性 是 子 程序 的 独立 编译 的 功 
能 。 没 有 独立 编译 ， 在 一 个 程序 中 进行 任何 改动 ， 都 需要 重新 编译 整个 程序 。Fortran I 缺乏 子 
程序 独立 编译 功能 ，704 机 器 不 可 靠 ,， 两 者 结合 在 一 起 ， 使 得 程序 的 长 度 受到 很 大 限制 : 程序 
最 多 只 能 有 300 一 400 行 (Wexelblat，1981，p. 68) 。 较 长 的 程序 很 少 能 够 在 死机 之 前 完成 编译 。 
Fortran I 允许 将 预先 编译 好 的 子 程序 机 器 码 包 括 进 程序 ， 这 极 大 地 缩短 了 编译 的 过 程 。 


2.3:5 Fortran IV、77、90、95 和 2003 


Fortran II 从 来 没有 得 到 广泛 应 用 。 而 Fortran IV 成 了 当时 最 广泛 使 用 的 一 种 程序 设计 语言 。 
它 的 发 展 时 期 是 从 1960 年 到 1962 年 ， 并 在 1966 年 被 标准 化 成 为 Fortran 66 (ANSI, 1966), 
Fortran 66 这 个 名 称 很 少 被 使 用 。 在 许多 方面 ，Fortran IV 是 Fortran II 的 扩展 ， 其 中 最 重要 的 扩展 
包括 变量 类 型 的 显 式 声明 、If 逻 辑 结 构 ， 以 及 将 子 程序 作为 参数 传递 给 其 他 子 程序 的 能 

Fortran 77 后 来 又 替代 了 Fortran IV， 并 在 1978 年 成 为 了 新 的 标准 (ANSI，1978a) Fortran 
77 保 持 了 Fortran IV 的 大 部 分 特性 ， 并 且 新 增 了 字符 串 的 处 理 、 逻 辑 循环 控制 语句 ， 以 及 IE 与 
可 选择 的 Else 所 构成 的 一 个 子 句 。 

Fortran 90 (ANSI，1992) 与 Fortran 77 有 着 巨大 的 不 同 。 最 大 的 变动 是 加 入 了 动态 数组 、 
记录 、 指 针 、 多 选择 语句 和 模块 。 而 且 ，Fortran 90 子 程序 也 能 被 递归 调用 。 

Fortran 90 的 定义 中 包括 了 一 种 新 概念 ， 即 需要 从 早期 Fortran 版 本 中 删 掉 一 些 语言 特性 。 尽 
管 Fortran 90 包 含 了 Fortran 77 的 所 有 特性 ， 但 有 两 个 表 列 出 的 特性 是 专门 留待 未 来 Fortran 语 言 的 
新 版 本 删除 的 。 废 弃 特 性 表 列 出 了 可 能 在 Fortran 90 的 下 一 个 版 本 中 删除 的 特性 。 

Fortran 90 包 括 了 两 种 简单 的 语法 改进 ， 这 些 改进 改变 了 程序 与 文字 描述 语言 的 外 观 。 首 先 ， 
去 掉 了 对 于 代码 固定 形式 的 要 求 ， 即 要 求 在 特殊 的 字符 位 置 编写 语句 的 特定 部 分 。 例 如 ， 语 句 
的 标记 只 能 出 现在 前 面 的 五 个 位 置 上 ， 而 语句 只 能 从 第 七 个 位 置 开始 。 这 种 死板 的 代码 形式 是 
设计 用 于 军 孔 卡 的 。 第 二 种 改变 是 语言 名 称 的 正式 拼 法 由 FORTRAN 改 变 为 Fortran 。 这 种 改变 
是 因 Fortran 程 序 中 传统 协定 的 改变 而 改变 ， 即 关键 字 以 及 标识 符 全 部 使 用 大 写字 母 。 现 在 的 协 
定 是 ， 只 有 关键 字 及 标识 符 的 第 一 个 字母 使 用 大 写 。 

Fortran 95 (INCITS/ISO/IEC，1997) 是 进一步 发 展 该 语言 的 结果 ， 但 是 与 前 一 版 相 比 ， 只 作 
了 很 少 的 改动 。 为 了 改进 Fortran 程 序 的 并 行 化 ， 引 入 了 一 种 新 的 迭代 结构 Forall。 

Fortran 语 言 的 最 新 版 本 Fortran2003 (Metcalf et al., 2004) 引 入 了 市 参数 的 派生 类 型 ， 它 支持 
面向 对 象 程序 设计 、 过 程 指 针 和 与 C 语 言 的 互 操作 性 。 


O 事实 上 ，Fortran 语 言 工 作 组 相信 ， 由 他 们 的 编译 器 产生 的 代码 至 少 超出 手工 编码 的 代码 速度 的 一 半 ， 不 然 ， 


用 户 将 不 会 接受 这 种 语言 。 
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2.3.6 评估 


最 初 的 Fortran 语言 设计 小 组 认为 ,语言 设计 仅仅 是 设计 翻译 器 这 个 关键 性 工作 的 必需 前 奏 。 
他 们 其 至 从 来 都 没有 想 过 ，Fortran 语 言 会 应 用 于 非 IBM 制 造 的 计算 机 上 。 确 实 ， 只 是 因为 IBM 
704 的 后 代 机 器 ，IBM 709， 在 推出 704 机 器 上 的 Fortran 编 译 器 之 前 就 宣告 诞生 ， 他 们 才 被 迫 不 
得 不 芳 虑 为 其 他 的 IBM 机 器 建造 Fortran 编 译 器 。Fortran 语 言 对 各 种 计算 机 使 用 的 影响 ， 连 同 后 
来 所 有 的 程序 设计 语言 都 得 益 于 Fortran 语 言 的 事实 ， 的 确 让 人 感叹 ， 它 当初 的 设计 人 员 的 目标 
是 多 么 具有 远见 。 

Fortran I 以 及 在 Fortran 90 之 前 的 所 有 后 代 语 言 具 有 的 一 个 能 够 允许 高 度 优化 的 编译 器 特性 
是 ， 在 运行 之 前 ， 将 所 有 变量 的 类 型 及 其 存储 位 置 都 固定 下 来 ， 而 在 运行 期 间 不 再 分 配 新 的 变 
量 或 者 存储 空间 。 这 是 以 牺牲 灵活 性 的 代价 来 换取 简单 性 和 高 效率 。 但 是 ， 这 种 方式 排除 了 递 
归 式 子 程 序 的 可 能 性 ， 并 且 使 得 难以 实现 动态 生长 或 改变 形状 的 数据 结构 。 当 然 ， 在 Fortran 初 
期 版 本 的 发 展 时 期 ， 程 序 的 开发 主要 是 用 于 数值 计算 ， 它 们 与 近代 的 软件 项 目 相 比 十 分 简单 ， 
因而 当时 的 这 种 牺牲 还 不 算 巨 大 。 

总 而 言 之 ，Fortran 语 言 的 成 功 ， 显 著 而 且 是 永远 地 改变 了 计算 机 的 使 用 方式 。 这 种 说 法 决 
不 言 过 其 实 。 当 然 ， 这 在 很 大 程度 上 是 由 于 它 是 第 一 种 广泛 应 用 的 高 级 语言 。 比 较 后 来 的 程序 
设计 语言 原理 ， 以 及 后 来 开发 的 程序 设计 语言 ， 人 们 必须 接受 的 事实 是 ，Fortran 语 言 的 早期 版 
本 在 许多 方面 都 存在 着 缺陷 。 这 正如 同 不 能 跨越 时 代 ， 将 1910 年 的 T 型 福特 汽车 与 2005 年 的 福 
特 野 马 型 相 比 一 样 。 另 外 ， 尽 管 Fortran 语 言 也 有 不 足 ， 但 是 ， 投 入 Fortran 软 件 的 巨大 投资 是 使 
它 始 终 立 于 最 广泛 应 用 的 高 级 语言 之 列 的 主要 原因 之 一 。 

ALGOL 60 语 言 的 设计 者 之 一 Alan Perlis， 在 1978 年 曾 就 Fortran 说 道 , “Fortran 语言 是 计算 
世界 的 混合 语言 。 它 是 普通 人 使 用 的 语言 ， 这 样 说 是 误 义 的 ， 而 不 是 贬义 的 。 因 为 它 已 经 成 为 
充满 活力 的 商务 世界 里 最 耀眼 的 一 颗 星 ， 所 以 它 已 经 生存 下 来 了 ， 并 且 还 将 生存 下 去 ， 
(Wexelblat, 1981, p.161) 

下 面 是 Fortran 95 程 序 的 一 个 例子 : 


! Fortran 95 Example program 
! Input: An integer, List Len, where List Len is less 
! than 100, followed by List Len-Integer values 
! Output: The number of input values that are greater 
! than the average of all input values 
Implicit none 
Integer Dimension (99):: Int List 
Integer :: List_Len, Counter, Sum, Average, Result 
Result= 0 
Sum = 0 
Read *, List Len 
If ((List_Len > 0) .AND. (List Len < 100)) Then 
! Read input data into an array and compute its sum 
Do Counter = 1, List Len 
Read *, Int _List(Counter) 
Sum = Sum + Int_List (Counter) 
End Do 
! Compute the average 
Average = Sum / List Len 
Count the values that are greater than the average 
Do Counter = 1, List Len 
If (Int_List(Counter) > Average) Then 
Result = Result + 1 
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End If 
End Do 
! Print the result 
Print *, 'Number of values > Average is:', Result 


Else 
Print *, 'Error - list length value is not legal' 


End If 
End Program Example 


2.4 函数 式 程 序 设 计 语 言 : LISP 


第 一 种 函数 式 程序 设计 语言 是 为 了 提供 表 数 据 处 理 的 语言 特性 而 发 明 的 ， 后 来 人 们 对 函数 
式 程序 设计 语言 的 需要 超出 了 它 最 初 在 人 工 智能 (AI) 领域 的 应 用 。 


2.4.1 人 工 智能 与 链表 数据 处 理 的 开始 


从 20 世 纪 50 年 代 中 期 开始 ， 人 们 在 许多 不 同 的 领域 对 人 工 智 能 产生 了 兴趣 。 一 些 兴 趣 来 自 
语言 学 领域 ， 一 些 来 自 心 理学 领域 ， 而 另 一 些 则 来 自 数 学 领域 。 语 言 学 家 们 关心 的 是 自然 语言 
的 处 理 ， 心 理学 家 们 感 兴趣 的 则 是 模拟 人 类 大 脑 信息 的 存储 与 检索 ， 以 及 其 他 一 些 大 脑 的 基本 
过 程 ， 数 学 家 们 感 兴趣 的 是 某 些 特定 智能 过 程 的 机 器 化 ， 例 如 定理 的 证 明 。 所 有 这 些 方面 的 研 
究 达成 了 一 致 的 结论 : 必须 开发 一 些 方法 ， 使 得 计算 机 能 处 理 链表 中 的 符号 数据 。 而 当时 几乎 
所 有 的 计算 都 是 数组 的 数值 运算 。 

表 处 理 的 概念 是 由 Allen Newell, J. C. Shaw 和 Herbert Simon 提 出 的 。 这 个 概念 第 一 次 发 
表 是 在 他 们 的 一 篇 经 典 的 论文 中 。 该 论文 描述 了 最 早 的 人 工 智 能 程序 之 一 、 名 为 “Logical 
Theorist” “的 程序 , 并且 还 描述 了 一 种 可 以 实现 这 个 程序 的 程序 设计 语言 (Newell and Simon, 
1956)。 这 个 被 命名 为 IPL-I (Information Processing Language 1， 信息 处 理 语言 1) 的 语言 从 
来 没有 被 实现 过 。 它 的 下 个 版 本 被 命名 为 IPL-II， 在 兰 德 (Rand) 公司 的 Johnniac 计 算 机 上 
KEL ST. IPL 语言 的 开发 工作 一 直 持 续 到 1960 年 。 在 这 一 年 ， 发 表 了 关于 IPL-V 语 言 的 描 
述 (Newell and Tonge，1960)。 然 而 IPL 语 言 的 低层 次 妨碍 了 它 的 广泛 使 用 。IPL 语言 实际 
上 是 为 一 种 假想 的 计算 机 而 开发 的 汇编 语言 ， 实 现 于 一 个 包括 了 表 处 理 指 令 的 解释 器 上 。 因 
为 它 第 一 次 的 实际 实现 是 在 毫 无 名 气 的 Johnniac 机 器 上 ， 这 也 成 为 妨碍 IPL 语言 流行 的 另 一 
个 原因 。 

IPL 语 言 所 作 的 贡献 是 它们 关于 表 结 构 的 设计 ， 以 及 它们 所 示范 的 表 处 理 方 法 的 可 行 性 与 实 
用 性 。 

IBM 从 20 世 纪 50 年 代 中 期 开始 对 人 工 智 能 感 兴趣 ， 并 且 选 择 了 定理 证 明 作为 其 示范 领域 。 
当时 ，Fortran 语 言 的 项 目 仍然 在 进行 。Fortran I 编 译 器 的 高 昂 代 价 使 得 IBM 认 为 ， 应 该 将 他 们 的 
表 处 理 功 能 附加 到 Fortran 语 言 上 ， 而 不 是 以 一 种 新 的 语言 形式 出 现 。 因 而 IBM 设 计 并 实现 了 
Fortran 表 人 处理 语言 (Fortran List Processing Language，FLPL) ， 并 将 其 作为 Fortran 语 言 的 一 种 
扩展 形式 。FLPL 被 用 来 建造 一 个 平面 几何 学 定理 证 明 器 ， 这 在 当时 被 认为 是 机 械 定理 证 明 领 域 
里 一 个 最 容易 的 区 域 。 


2.4.2 LISP 的 设计 过 程 


暴 省 理工 学 院 的 John McCarthy 于 1958 年 在 IBM 信 息 研 究 部 门 得 到 一 个 夏天 的 工作 位 置 。 那 
© Logical Theorist 发 现 了 命题 微 积 分 中 的 定理 证 明 。 
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个 夏天 他 的 目标 是 研究 符号 运算 ， 并 且 为 进行 这 种 类 型 的 运算 开发 一 组 语言 需求 。 作 为 先行 例 
子 的 问题 范围 ， 他 选择 了 代数 表达 式 的 差分 。 他 从 这 项 研究 里 得 到 了 一 系列 的 语言 需求 ， 其 中 
包括 数学 函数 的 控制 流程 方法 : 递归 与 条 件 表 达 式 。 而 在 当时 ， 唯 一 的 高 级 语言 Fortran I 中 没 
有 这 些 方法 。 

从 符号 差分 的 研究 中 得 出 的 另 一 个 需求 是 动态 地 分 配 链表 结构 的 需要 ， 以 及 将 废弃 的 表 结 
构 以 某 种 隐 式 方式 解除 分 配 。McCarthy 所 要 求 的 仅仅 是 不 允许 一 些 显 性 解除 分 配 语句 搅乱 他 深 
亮 的 差分 算法 。 

因为 FLPL 语 言 不 支持 递归 运算 、 条 件 表 达 式 、 动 态 存储 空间 的 分 配 或 动态 隐 性 解除 分 配 ， 
McCarthy 当 时 十 分 清楚 : 必须 要 发 明 一 种 新 的 语言 。 

当 McCarthy 于 1958 年 秋天 回 到 麻 省 理工 学 院 时 ， 他 和 Marvin Minsky 用 从 电子 研究 实验 室 
得 到 的 研究 基金 组 成 了 麻 省 理工 学 院 人 工 智能 项 目 。 在 这 个 项 目 中 所 做 的 第 一 个 重要 工作 就 
是 开发 一 个 表 处 理 系统 。 他 们 首先 实现 了 McCarthy 所 提议 的 、 被 称 为 “听取 建议 者 ”(Advice 
Taker) 的 程序 。 这 项 应 用 成 为 开发 表 处 理 语言 LISP 的 动力 。LISP 语 言 的 第 一 个 版 本 有 时 候 
被 称 为 纯 LISP 语 言 ， 因 为 它 是 一 种 纯粹 的 函数 式 语言 。 下 面 的 小 廊 将 描述 纯 LISP 语 言 的 发 展 
过 程 。 


2.4.3 语言 概述 


2.4.3.1 数据 结构 

纯 LISP 语 言 只 有 两 种 数据 结构 : 原子 与 表 。 原 子 是 具有 标识 符 形 式 的 符号 ， 或 者 是 数值 的 
文字 常数 。 在 链表 结构 中 存储 符号 信息 的 概念 是 目 然 的 ， 而 且 这 种 概念 已 经 被 应 用 于 IPL-I 中 。 
这 种 结构 允许 在 任何 位 置 进行 插入 与 删除 操作 ， 这 两 种 操作 被 认为 是 表 处 理 的 必要 部 分 。 然 而 ， 
当 LISP 语 言 的 开发 最 终 完 成 以 后 ，LISP 程 序 却 几乎 不 需要 这 两 种 操作 。 

表 结 构 的 说 明 方 式 是 将 其 元 素 包括 在 括号 之 内 。 人 简单 表 的 元 素 仅 限于 原子 ， 具 有 下 面 的 形式 : 

(A B C D) 

KERABA S RHH., Plan, TEARRE 

(A (B C) D (E (F G))) 

是 由 四 个 元 素 组 成 。 第 一 个 元 素 是 原子 A， 第 二 个 元 素 是 子 表 (BC) 第 三 个 元 素 是 原 
FD; 第 四 个 元 素 是 子 表 (E (F G))， 而 它 义 以 子 表 (FC) 作为 它 的 第 二 个 元 素 。 

在 计算 机 内 部 ， 表 通 稼 被 存储 为 单 癌 链表 结构 ， 在 这 种 结构 中 ， 每 个 节点 具有 两 个 指针 ， 
并 且 每 个 节点 代表 一 个 表 元 素 。 一 个 原子 节点 的 第 一 指针 指向 这 个 原子 的 某 种 表示 ， 例 如 ， 这 
个 原子 的 符号 或 者 数值 ， 或 者 指向 一 个 子 表 的 指针 。 一 个 子 表 元 素 市 点 的 第 一 指针 指向 这 个 子 
表 元 素 的 第 一 个 市 点 。 在 以 上 两 种 情况 下 ， 一 个 市 点 的 第 二 指针 都 指向 该 表 的 下 一 个 元 素 。 表 
是 由 一 个 指 癌 它 的 第 一 个 元 素 的 指针 来 ?| 用 的 。 

图 2-2 描 述 了 上 面 例子 中 两 个 表 的 内 部 表示 。 请 注意 ， 表 的 元 素 是 水 平 显 示 的 。 表 的 最 后 一 
THAIS A cH, AEN HR NIL; 在 图 2-2 中 ， 在 元 素 的 位 置 上 使 用 一 条 和 斜 线 来 表示 
NIL。 子 表 也 使 用 同样 的 结构 表示 。 


O 听取 建议 者 (Advice Taker) 程序 ， 使 用 一 种 形式 语言 编写 的 句子 来 表示 信息 ， 并 且 使 用 一 种 逻辑 引用 过 程 
来 确定 步骤 。 
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A B C D 
A D 
B C E 
EUs MA 
F G 


图 2-2 两 个 LISP 表 的 内 部 表示 


2.4.3.2 函数 式 程序 设计 的 过 程 

MISP 语 言 是 作为 函数 式 程序 设计 语言 而 设计 的 。 函 数 式 程序 中 的 所 有 运算 都 是 通过 在 自 恋 
世上 应 用 函数 来 完成 。 在 命令 式 语言 程序 中 所 具有 的 丰富 的 赋值 语句 及 变量 ， 在 函数 式 语 计 的 
程 序 中 都 是 不 必要 的 。 此 外 ， 选 代 过 程 可 以 被 声明 为 递归 函数 的 调用 ， 这 样 使 得 循环 也 不 需要 
T. 这些 函 数 式 程序 设计 的 基本 概念 ， 使 得 它 与 命令 式 语言 程序 设计 显著 不 同 ， 

2.4.3.3 LISP 的 语法 

LISP 请 言 与 命令 式 语 言 有 着 很 大 的 不 同 ， 首 先 因为 它 是 一 种 函数 式 程序 设计 语言 ， 其 次 因 
为 LISP 的 程序 看 起 来 与 Java 或 者 C++ 程序 有 很 大 不 同 。 例 如 ，Java 的 语法 是 一 种 英文 与 代数 
的 复杂 混合 ， 而 LISP 的 语法 则 是 一 种 简单 性 的 典范 。LISP 的 程序 代码 与 数据 具有 完全 相同 的 形 
A: 即 被 括号 包括 的 表 。 让 我 们 再 一 次 考虑 表 

(A BC D) 

当 你 将 它 解 释 成 数据 时 ， 它 是 一 个 四 个 元 素 的 表 。 而 当 你 将 它 视 作 代码 时 ， 它 是 一 个 名 称 
为 AR 的 国 数 作 用 于 三 个 参数 ，B、c 和 D， 


2.4.4 评估 


LISE 语 言 完全 垄断 人 工 智能 应 用 领域 长 达 四 分 之 一 世纪 之 久 。 许多 导致 LISP 语 言 具有 极 低 
效率 名 声 的 因素 已 经 被 除去 。 现在 所 实现 的 多 种 系统 都 是 编译 式 的 ， 产生 的 代码 比 在 解释 器 上 
运行 源 程序 要 快 得 多 。 除 了 在 人 工 智能 领域 中 的 成 功 之 外 ， LISP 是 国 数 式 程序 设计 领域 内 的 先 
W, FKEA, 这 个 领域 是 程序 设计 语言 研究 方面 一 个 充满 活力 的 区 域 。 如 在 第 1 章 中 所 述 ， 
许多 程序 设计 语言 的 研究 人 员 相信 ， 在 软件 开发 中 ， 图 数 式 程序 设计 是 比 命令 式 语 言 优越 得 多 
的 工具 。 

下 面 古 一 个 LISP 程 序 的 例子 : 


LISP Example function 

The following code defines a LISP predicate function 
that takes two lists as arguments and returns True 
if the two lists are equal, and NIL (false) otherwise 
(DEFUN equal lists (lisl lis2) 
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(COND 
((ATOM lisl) (EQ lisl lis2)) 
((ATOM lis2) NIL) 
((equal_ lists (CAR lisl) (CAR lis2)) 

(equal lists (CDR lisl) (CDR lis2))) 

(T NIL) 

) 

) 


2.4.5 LISP 的 两 种 后 代 语 言 


LISP 语言 的 两 种 方言 ，COMMON LISP 和 Scheme， 现 在 被 广泛 地 应 用 。 我 们 将 在 下 面 的 几 
市 简略 地 进行 讨论 。 | 

2.4.5.1 Scheme 

Scheme 方言 于 20 世 纪 70 年 代 中 期 出 现 于 麻 省 理工 学 院 (Sussman and Steele, 1975), 它 的 
特征 为 小 巧 、 独 特地 使 用 静态 作用 域 (将 在 第 5 章 中 讨论 )， 以 及 将 函数 处 理 为 第 一 类 实体 。 作 
为 第 一 类 实体 ，Scheme 中 的 函数 可 以 是 表达 式 的 值 和 表 中 的 元 素 ， 它 们 可 以 被 赋予 变量 ， 可 以 
馈 作 为 参数 传递 ， 或 者 作为 函数 调用 的 返回 值 。 早 期 的 LISP 版 本 并 没有 提供 所 有 的 这 些 功能 ， 
也 并 没有 使 用 静态 作用 域 。 

作为 具有 简单 语法 与 语义 的 小 型 语言 ，Scheme 方言 很 适合 教育 应 用 领域 ， 例 如 用 于 函数 式 
程序 设计 课程 ， 以 及 程序 设计 一 般 性 介绍 课程 。 如 前 面 提 到 的 ， 我 们 将 在 第 15 章 描述 Scheme 
方言 的 细节 。 | 

2.4.5.2 COMMON LISP 

在 20 世 纪 70 年 代 至 80 年 代 早期 ， 人 们 开发 并 且 运 用 了 LISP 的 许多 不 同 的 方言 。 这 导致 了 我 
们 熟悉 的 移植 性 问题 。 为 了 解决 这 个 问题 ， 人 们 开发 了 COMMON LISP (Graham, 1996), 
COMMON LISP 方 言 的 创建 意图 是 为 了 将 开发 于 20 世 纪 80 年 代 初期 的 几 种 LISP 方 言 (包括 
Scheme) 的 特性 结合 进 一 种 语言 之 中 。 身 为 这 样 一 种 混合 物 的 COMMON LISP 成 为 一 种 大 而 复 
条 的 语言 。 然 而 它 的 基础 还 是 纯 LISP 语言 ， 因 此 它 的 语法 、 基 本 功能 以 及 基本 的 本 质 都 来 自 
于 纯 LISP 语言 。 

认识 到 动态 作用 域 所 能 提供 的 灵活 性 以 及 静态 作用 域 的 简单 性 ，COMMON LISP 兼 有 这 两 
种 作用 域 。 而 变量 的 默认 作用 域 为 静态 作用 域 ， 但 是 通过 声明 变量 为 special， 该 变量 的 作用 
域 就 可 以 变 成 是 动态 的 。 | 

COMMON LISP 方 言 具 有 大 量 的 数据 类 型 与 数据 结构 ， 其 中 包括 记录 、 数 组 、 复 数 以 及 字 
符 串 。 它 还 具有 包 的 形式 用 来 将 函数 和 数据 的 集合 模块 化 ， 以 提供 访问 控制 。COMMON LISP 
方言 将 在 第 15 章 中 进一步 描述 。 


2.4.6 相关 语言 


元 语言 (MetaLanguage，ML) (Ullman, 1998) 最 初 由 Robin Milner 于 20 世 纪 80 年 代 ， 在 爱 
本 您 大 学 为 一 个 名 为 “用 于 可 计算 函数 的 逻辑 ”(Logic for Computable Functions, LCF) 的 程序 
他 证 系统 设计 的 元 语言 (Milner et al.，1990)。 元 语言 基本 上 是 一 种 函数 式 语言 ， 但 是 它 也 支持 
命令 式 程序 设计 。 不 同 于 LISP 以 及 Scheme 方 言 ， 元 语言 中 每 一 个 变量 的 类 型 以 及 表达 式 的 类 型 
都 可 以 在 编译 时 决定 。 类 型 与 变量 的 实体 相关 联 ， 而 不 是 与 变量 的 名 字 相 关联 。 表 达 式 的 类 型 
是 从 表达 式 所 处 环境 来 推断 的 ， 这 些 我 们 将 在 第 7 章 里 讨论 。 

不 同 于 LISP 和 Scheme 方 言 ， 元 语言 不 使 用 源 于 Lambda 表 达 式 的 、 运 用 括号 的 函数 式 语法 ， 
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相反 ， 元 语言 的 语法 仿效 了 命令 式 语言 的 语法 ， 如 Java 和 C++, 

Miranda 语 言 是 由 David Turner 于 20 世 纪 80 年 代 初 期 在 英国 坎特伯雷 的 肯特 大 学 开发 的 
(Turner，1986)。Miranda 部 分 地 基于 ML、SASL 和 和 KRC 语言 。 而 Haskell 语 言 (Hudak and Fasel, 
1992) 则 在 很 大 程度 上 是 基于 Miranda 语 言 的 。 类 似 于 Miranda 语言 ，Haskell 是 一 种 纯 函数 式 语 
言 ， 不 具有 变量 与 赋值 语句 。Haskell 的 另 一 个 十 分 独特 的 特征 是 使 用 懒惰 求 值 ， 即 仅 当 需要 表 
达 式 的 值 时 才 进 行 计算 。 这 种 特性 导致 了 这 种 语言 中 一 些 出 人 意料 的 功能 。 

元 语言 和 Haskell 语言 都 将 在 第 15 章 中 简略 地 讨论 。 


2.5 返回 成 熟 的 第 一 步 : ALGOL 60 
ALGOL 60 对 后 来 的 程序 设计 语言 有 着 巨大 的 影响 ， 因 此 它 是 语言 历史 回顾 中 的 重要 核心 ， 
2.5.1 历史 背景 


ALGOL 60 的 出 现 源 自信 们 企图 设计 一 种 科学 应 用 领域 的 通用 语言 。 在 1954 年 年 底 之 前 ， 
Laning 和 Zierler 的 代数 系统 已 经 经 过 了 一 年 多 的 运行 ， 并且 有 关 Fortran 语 言 的 第 一 个 报告 已 经 
发 表 了 。 到 了 1957 年 ，Fortran 语 言 已 成 为 现实 ， 而 且 其 他 的 一 些 高 级 程序 设计 语言 也 正在 开发 
之 中 。 这 些 语言 中 最 有 名 的 是 由 Carnegie Tech 的 Alan Perlis 设 计 的 IT 语言 ， 以 及 两 种 为 UNIVAC 
计算 机 设计 的 语言 ， 即 MATH-MATIC 语 言 和 UNICODE 语 言 。 语 言 的 繁多 使 得 用 户 之 间 难 以 交 
六 。 此 外 ， 所 有 这 些 新 语言 都 是 围绕 着 单一 的 计算 机 体系 结构 开发 的 ， 一 些 用 于 UNIVAC 计 算 
机 ， 而 另 一 些 则 用 于 IJBM 的 700 号 系列 机 器 。 针 对 这 种 语言 种 类 激增 的 情况 ， 美 国 的 一 些 主要 计 
算 机 用 户 组 织 ， 包 括 IBM 科学 计算 用 户 团 体 (the IBM scientific user group, SHARE) 和 
UNIVAC 科 学 计算 交换 (UNIVAC Scientific Exchange，USE， 一 个 大 规模 的 UNIVAC 科 学 计算 
用 户 组 织 )， 于 1957 年 5 月 10 日 向 美国 计算 机 协会 (ACM) 递交 了 一 份 请 求 信 ， 要 求 组 成 一 个 委 
员 会 来 研究 并 推荐 一 种 通用 的 程序 设计 语言 。 虽 然 Fortran 是 可 能 的 候选 语言 ， 但 由 于 它 当 时 是 
归 IBM 所 独 有 ， 因 此 不 能 成 为 这 样 一 种 通用 语言 。 

在 此 前 的 1955 年 ， 应 用 数学 与 力学 协会 ( 德 文 缩写 为 GAMM) 也 已 经 成 立 一 个 委员 会 ， 为 
各 种 类 型 的 计算 机 设计 一 种 通用 的 、 独 立 于 机 器 的 算法 语言 。 这 种 对 于 新 语言 的 渴求 ， 部 分 是 
出 于 欧洲 人 对 IBM 占 支配 地 位 的 惧怕 。 然 而 ， 在 1957 年 年 底 ， 几 种 高 级 语言 相继 在 美国 诞生 ， 
这 才 使 得 这 个 GAMM 的 子 委员 会 认为 创建 通用 语言 的 工作 也 应 该 包括 美国 人 ， 因 而 该 委员 会 向 
美国 计算 机 协会 (ACM) 呈 递 了 一 封 邀 请 信 。1958 年 4 月 ，GAMM 的 Fritz Bauer 将 正式 提议 送 
交 ACM 之 后 ， 这 两 个 组 织 正式 同意 联合 开发 一 个 语言 设计 项 目 。 


2.5.2 早期 设计 过 程 


GAMM 和 ACM 决定 ， 每 个 协会 派 四 个 成 员 参 加 第 一 次 联合 设计 语言 的 会 议 。 这 个 会 议 于 
1958 年 5 月 27 日 至 6 月 1 日 在 苏黎世 举行 ， 一 开始 它 就 为 新 的 语言 设立 了 下 列 目标 ; 

“这 种 语言 的 语法 应 该 尽 可 能 地 接近 数学 的 标准 记 法 ， 并 且 ， 由 这 种 语言 编写 的 程序 在 没 

有 解释 的 情况 下 应 该 是 可 读 的 。 

* 它 应 该 可 以 被 用 作出 版 物 中 描述 计算 过 程 的 语言 。 

* 由 这 种 新 语言 编写 的 程序 应 该 能 够 被 计算 机 翻译 成 机 器 语言 。 

这 里 的 第 一 个 目标 说 明 这 种 新 语言 将 要 用 于 科学 领域 的 程序 设计 ， 这 是 当时 计算 机 的 主要 
应 用 领域 。 第 二 个 目标 对 当时 的 计算 机 界 是 全 新 的 要 求 。 最 后 一 个 目标 则 对 任何 程序 设计 语言 


由 于 人 们 观点 的 不 同 ， 苏 歼 世 会 议 有 可 能 产生 重大 的 结果 ， 也 有 可 能 引出 永 无 休止 的 争论 。 
实际 上 这 两 种 情况 都 存在 。 会 议 的 本 身 包括 了 无 数 的 妥协 ， 既 是 在 与 会 的 个 人 之 间 ， 也 是 在 大 西 
洋 的 两 崖 之 间 。 在 有 些 情况 下 ， 这 些 妥 协 有 时 计较 的 是 对 于 全 球 的 影响 ， 而 不 是 一 些 重要 的 问题 。 
是 使 用 逗号 (欧洲 方式 ) 还 是 使 用 句号 (美国 方式 ) 来 表示 小 数 点 的 问题 ， 就 是 一 个 例子 。 


2.5.3 ALGOL 58 概 况 


在 办 黎 世 会 议 上 设计 的 语言 被 命名 为 国际 算法 语言 (International Algorithmic Language, 
IAL)。 在 设计 期 间 被 提议 称 为 ALGOL 语 言 ， 意 为 算法 语言 ， 但 是 因为 这 个 名 称 没有 反映 出 联 
合 委员 会 的 国际 性 而 遭 到 了 拒绝 。 然 而 在 第 二 年 ， 它 的 名 称 又 被 改 成 了 ALGOL， 这 个 语言 后 来 
以 ALGOL 58 闻 名 于 世 。 

在 许多 方面 ， ALGOL 58 是 Fortran 的 一 个 后 代 语 言 ， 这 是 很 明显 的 。 它 将 Fortran 的 许多 语 
言 特性 通用 化 了 ， 并 增加 了 一 些 新 的 结构 和 新 的 概念 。 这 些 通用 化 ， 一 部 分 与 不 允许 将 语言 
于 任何 特定 机 器 的 目的 有 关 ， 而 另 一 些 则 是 企图 使 这 种 语言 更 灵活 、 功 能 更 强大 。 在 这 些 努力 
之 下 ， 一 种 罕见 的 简单 与 完美 的 组 合 出 现 了 。 

ALGOL 58 形 式 化 了 数据 类 型 的 概念 ， 虽 然 仅 是 非 浮 点 数 的 变量 需要 有 显 性 的 类 型 声明 。 
ALGOL 58 增 加 了 复合 语句 的 概念 ， 这 个 概念 被 几乎 所 有 后 续 程 序 设计 语言 所 吸收 。 一 些 
Fortran 语 言 的 特性 在 被 通用 化 之 后 包括 进 了 ALGOL 58 之 中 : 标识 符 可 以 具有 任意 的 长 度 ， 这 
与 Fortran 语 言 的 最 多 六 个 字符 的 限制 相反 ， 数 组 可 以 具有 任意 的 维 数 ， 这 不 同 于 Fortran 语 言 所 
规定 的 最 多 只 能 有 三 个 维 数 ， 数 组 的 下 界 可 以 由 程序 人 员 来 定义 ， 然 而 在 Fortran 语 言 中 ， 数 组 
下 界 被 隐 性 地 规定 为 1， 人 允许 嵌 套 选 择 语句 ， 而 在 Fortran 语 言 中 则 不 能 。 

ALGOL 58 以 相当 不 寻常 的 方式 获得 了 它 的 赋值 操作 符 。Zuse 曾 经 在 Plankalkiil 语 言 中 使 用 

表达 式 => 变量 
的 形式 作为 赋值 语句 。 尽 管 Plankalkiil 语言 还 没有 发 布 ， 但 是 ALGOL 58 委员 会 的 一 些 欧洲 
成 员 熟 悉 这 种 语言 。 委 员 会 考虑 过 Plankalkiil 语言 的 这 种 赋值 语句 的 形式 ， 但 是 因为 有 关 字 符 
限制 性 的 和 争论” ， 大 于 号 被 改 成 了 冒号 。 然 后 多 半 是 由 于 美国 人 的 坚持 ， 整 个 语句 被 改 为 下 面 
的 形式 : 

变量 := 表达 式 

欧洲 人 则 更 喜欢 与 此 相反 的 表达 形式 ， 然 而 ， 那 就 正好 是 Fortran 的 颠倒 形式 。 

2.5.4 ALGOL 58 报告 的 接受 


1958 年 12 月 发 表 的 关于 ALGOL 58 语 言 的 报告 (Perlis and Samelson, 1958) 得 到 了 极其 热烈 
的 反 啊 。 在 美国 ， 更 多 地 是 将 这 种 新 语言 视 为 一 种 程序 设计 语言 设计 思想 的 集合 ， 而 不 仅仅 是 
一 种 通用 的 标准 语言 。 实 际 上 ，ALGOL 58 语言 报告 的 本 意 并 不 是 提供 一 种 完成 了 的 产品 ， 而 
只 是 一 份 供 国 际 讨论 的 初步 文案 。 然 而 ， 三 个 主要 从 事 语言 设计 与 实现 工作 的 组 织 已 经 将 这 个 
报告 作为 他 们 工作 的 基础 。 在 密 吹 根 大 学 (the University of Michigan) 诞生 了 MAD 语 言 (Arden 
et al., 1961) ; 美国 海军 的 电子 科学 集团 (The U.S. Naval Electronics Group) 实现 了 NELIAC 
语言 (Huskey et al.，1963)， 系 统 开发 公司 (System Development Corporation) 设计 并 实现 了 
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JOVIAL 语 言 (Shaw，1963)。JOVIAL 是 “国际 代数 语言 的 Jules 版 本 ” (Jules*Own Version of the 
International Algebraic Language) 名 称 的 缩写 ， 它 代表 了 这 种 基于 ALGOL 58 并 唯一 得 到 三 到 应 
用 的 语言 (Jules 是 JOVIAL 的 设计 人 员 之 一 ， 他 的 全 名 为 Jules I. Schwartz), JOVIAL 之 所 以 被 
三 这 使 用 ， 是 因为 它 曾 经 在 长 达 四 分 之 一 个 世纪 中 被 用 作 美 国 空军 官方 的 科学 计算 语言 。 

美国 计算 机 界 的 其 余部 分 对 待 新 语言 就 不 是 那么 友好 。 起 初 ，IBM 及 其 主要 科学 计算 用 户 
组 织 SHARE 似 乎 都 欢迎 ALGOL 58, IBM ALGOL 58 的 报告 发 表 之 后 不 久 ， 即 开始 了 这 种 语 
言 的 实现 工作 ，SHARE 也 成 立 了 一 个 称 为 SHARE IAL 的 子 委员 会 来 研究 ALGOL 58。 该 子 委 
员 会 接 下 来 建议 ACM 应 该 实行 ALGOL 58 语言 的 标准 化 ， 并 提议 IBM 为 它 的 所 有 700 号 系列 
计算 机 都 实现 这 种 语言 。 然 而 这 种 热情 是 短暂 的 。 在 1959 年 春季 ，IBM 和 SHARE 都 通过 了 
Fortran 体验 期 ， 在 新 语言 的 开发 及 第 一 代 编译 器 使 用 方面 ， 以 及 在 培训 及 规劝 用 户 使 用 新 语言 
方面 ， 他 们 体验 到 了 开始 一 种 新 语言 所 具有 的 所 有 痛苦 与 代价 。 到 1959 年 中 期 ，IBM 和 
SHARE 显示 了 他 们 对 于 Fortran 的 既定 兴趣 ， 并 决定 在 IBM 700 系列 机 器 上 保留 Fortran， 以 
作为 他 们 的 科学 计算 语言 ， 并 因此 最 终 放 弃 了 ALGOL 58, 


2.5.5 ALGOL 60 的 设计 过 程 


在 1959 年 ， 关 于 ALGOL 58 的 辩论 在 欧洲 和 美国 激烈 地 展开 。 大 量 有 关 修改 和 增加 功能 的 
提议 在 欧洲 的 ALGOL Bulletin Communications of the ACM 上 发 表 。 在 1959 年 中 ， 最 重要 的 事 
件 之 一 是 苏黎世 委员 会 在 “信息 处 理 国 际会 议 ” 上 发 表 的 工作 报告 。 在 这 里 ，Backus 介绍 了 他 
用 来 换 述 程序 设计 语言 语法 的 新 标记 法 ， 后 来 这 种 方法 以 巴 科斯 -诺尔 范式 (Backus-Naur form, 
BNF) 命名 而 闻名 于 世 。 关 于 巴 科 斯 -诺尔 范式 ， 我 们 将 在 第 3 章 详细 介绍 。 

1960 年 1 月 ， 第 二 次 ALGOL 会 议 在 巴黎 举行 。 这 次 会 议 的 议题 是 要 讨论 80 项 已 经 正式 提交 
的 提案 。 丹 麦 的 Peter Naur 尽 管 不 是 苏黎世 委员 会 的 成 员 ， 但 他 十 分 积极 地 参与 了 ALGOL 的 开 
发 。 也 正 是 他 创建 并 且 出 版 了 ALGOL Bulletin。Naur 花 费 了 大 量 的 时 间 来 研究 Backus 介 绍 巴 科 
斯 -诺尔 范式 的 文章 ， 并 决定 应 该 正式 使 用 巴 科斯 -诺尔 范式 来 描述 1960 年 ALGOL 会 议 的 结果 ， 
在 对 巴 科斯 -诺尔 范式 进行 了 些微 改动 之 后 ， 他 用 巴 科 斯 -诺尔 范式 写 出 了 一 份 关 于 所 提议 的 新 
语言 的 描述 ， 并 在 会 议 开始 时 散发 给 与 会 的 1960 小 组 成 员 。 


2.5.6 ALGOL 60 语 言 概述 


1960 年 的 会 议 虽 然 仅 持续 了 六 天 ， 但 是 对 ALGOL 58 进 行 了 重大 的 修改 。 其 中 最 重要 的 新 
发 展 有 下 列 各 项 : 

e 91 入 了 块 结构 的 概念 。 这 将 允许 程序 人 员 通 过 引入 新 的 数据 环境 或 作用 域 ， 进 行程 序 部 

分 的 局 部 化 。 

* 允 主 使 用 两 种 不 同 的 方式 进行 子 程序 参数 的 传递 : 按 值 传递 与 按 名 传递 。 

“允许 递归 过 程 。 ALGOL 58 关 于 这 一 问题 的 描述 不 是 十 分 清楚 。 请 注意 ， 虽 然 递归 运算 对 

于 命令 式 语 言 还 是 狐 新 的 概念 ， 但 LISP 在 1959 年 就 已 经 提供 了 递归 功能 . 

* 允许 栈 动态 数组 。 栈 动态 数组 的 下 标 范围 由 变量 来 指定 ， 所 以 数组 的 大 小 是 在 数组 分 配 

存储 空间 时 就 被 确定 的 ， 这 发 生 于 执行 到 数组 声明 之 时 。 我 们 将 在 第 6 章 中 详细 描述 栈 动 

在 会 议 上 ， 入 们 还 提出 了 一 些 可 能 对 语言 的 成 功 或 失败 产生 巨大 影响 的 语言 特性 ， 然 而 这 
旦 提议 都 遭 到 了 否决 ， 其 中 最 重要 的 包括 格式 化 输入 和 输出 语句 。 之 所 以 未 被 采纳 ， 是 因为 人 
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ALGOL 60 的 报告 于 1960 年 5 月 发 表 (Naur, 1960), FBR ZUR EIS a AIA 
之 中 ， 第 三 次 会 议 已 经 预定 于 1962 年 4 月 在 罗马 召开 ， 以 讨论 遗留 问题 。 而 在 第 三 次 会 议 上 ， 会 
员 们 只 是 处 理 了 一 些 问 题 ， 没 有 被 允许 增加 语言 的 内 容 。 这 次 会 议 的 结果 发 表 在 题 为 “ALGOL 
60 算法 语言 的 修改 报告 ”之 中 (Backus etal., 1962), 


2.5.7 ALGOL 60 的 评估 


在 某 些 方面 , ALGOL 60 是 一 个 巨大 的 成 功 ， 而 在 男 一 些 方面 , 它 却 是 一 个 让 人 灰心 的 失败 。 
它 的 成 功 在 于 ， 它 几乎 立刻 就 成 为 计算 机 界 出 版 刊物 中 ， 交 流 算法 的 唯一 可 以 接受 的 形式 化 方 
法 ， 并 且 在 之 后 的 20 多 年 间 ， 它 始终 是 发 表 算 法 的 唯一 语言 。 自 1960 年 以 来 所 设计 的 每 一 种 命 
令 式 语言 ， 都 或 多 或 少 得 益 于 ALGOL 60。 大 部 分 的 语言 在 事实 上 都 是 直接 或 间接 的 ALGOL 60 
的 后 代 语 言 ， 例 如 PL/I、SIMULA 67, ALGOL 68、C、Pascal、Ada、C++ 以 及 Java 语言 。 

ALGOL 58/ ALGOL 60 语 言 的 设计 工作 包括 了 一 系列 的 “第 一 ”。 这 是 第 一 次 一 个 国际 组 织 
符 试 设计 一 种 程序 设计 语言 ， 它 是 被 设计 的 第 一 种 独立 于 机 器 的 语言 ， 它 也 是 第 一 种 形式 地 描 
述 语法 的 语言 。 巴 科斯 一 诺尔 范式 的 形式 化 方法 的 成 功 应 用 ， 开 拓 了 计算 机 科学 中 的 一 些 重要 
领域 : 形式 语言 、 语 法 分 析 理 论 ， 以 及 基于 巴 科 斯 -诺尔 范式 的 编译 器 设计 。 最 后 一 点 ， 
ALGOL 60 语 言 的 结构 影响 了 计算 机 的 体系 结构 。 其 中 最 令 人 瞩目 的 例子 ， 是 一 种 扩展 的 
ALGOL 60, 被 用 作 一 系列 大 型 计算 机 的 系统 语言 ， 如 Burroughs 的 B5000、B6000 和 B7000 型 机 
三， 这 些 机 右 设 计 了 硬件 栈 结 构 ， 以 便于 高 效率 地 实现 语言 中 的 块 结构 及 递归 子 程序 。 

然而 就 像 硬币 有 正 反 两 面 一 样 ， 这 个 故事 还 有 着 另外 的 一 面 ，ALGOL 60 从 来 没有 在 美国 
得 到 广泛 的 应 用 。 黄 至 就 是 在 欧洲 ， 即 使 这 种 语言 在 欧洲 远 比 在 美国 受 欢迎 ， 它 也 从 来 没有 成 
为 过 主要 的 语言 。 有 许多 原因 使 得 它 不 被 人 们 接受 。 原 因 之 一 ， 是 ALGOL 60 的 一 些 语言 特性 
过 分 灵活 ， 使 得 人 们 难于 理解 且 难 于 实现 。 说 明 这 个 问题 的 最 好 的 一 个 实例 是 以 按 名 传递 方法 
传递 参数 给 子 程序 ， 我 们 将 在 第 9 章 解 释 这 种 方法 。 实 现 ALGOL 60 的 困难 则 可 由 Rutishauser 于 
1967 年 所 做 的 概括 来 证 明 ， 这 就 是 ， 几 乎 不 存在 一 种 实现 包括 了 完整 的 ALGOL 60 语 言 
(Rutishauser, 1967, p.8), 

在 语言 中 缺乏 输入 和 输出 语句 ， 也 是 ALGOL 60 不 能 够 被 接受 的 另 一 个 主要 原因 。 依 赖 于 
实现 的 输入 /输出 ， 使 得 ALGOL 60 的 程序 很 难 被 移植 到 其 他 计算 机 上 。 

与 ALGOL 60 相 关联 的 、 对 于 计算 机 科学 最 重要 的 贡献 之 一 是 巴 科 斯 -诺尔 范式 ， 但 这 同时 
也 是 使 得 ALGOL 60 不 被 接纳 的 原因 。 虽 然 现在 巴 科斯 -诺尔 范式 被 认为 是 一 种 简单 和 完美 相 结 
合 的 语法 描述 方法 ， 但 对 于 1960 年 的 世界 ， 它 却 是 十 分 奇怪 和 复杂 的 。 

最 后 ， 尽 管 还 有 许多 其 他 问题 导致 ALGOL 60 不 能 被 广泛 应 用 ， 但 用 户 们 对 于 Fortran 语言 
的 固守 以 及 缺乏 IBM 的 支持 ， 或 许 才 是 其 中 最 重要 的 原因 。 

从 ALGOL 60 的 语言 描述 总 是 伴随 着 歧义 性 和 模糊 性 的 意义 上 来 说 ， ALGOL 60 语言 的 工 
作 从 来 就 没有 真正 地 完成 (Knuth, 1967), | 

下 面 是 ALGOL 60 程 序 的 一 个 例子 : 


comment ALGOL 60 Example Program 
Input: An integer, listlen, where listlen is less than 
100, followed by listlen-integer values 
Output: The number of input values that are greater than 
the average of all the input values 
begin 


40 R2 





integer array intlist [1:99]; 

integer listlen, counter, sum, average, result; 
sum := 0; 

result := 0; 

readint (listlen); 

if (listlen > 0) A (listlen < 100) then 


begin 
comment Read input into an array and compute the average; 
for counter := 1 step 1 until listlen do 
begin 


readint (intlist[counter] ); 
sum := sum + intlist[counter] 
end; 
comment Compute the average; 
average := sum / listlen; 
comment Count the input values that are > average; 
for counter := 1 step 1 until listlen do 
if intlist[counter] > average 
then result := result + 1; 
comment Print result; 
printstring("The number of values > average is:"); 
printint (result) 
end 
else 
printstring ("Error—input list length is not legal"); 
end 


26 商务 记录 计算 机 化 : COBOL 


COBOL 的 故事 在 某 种 意义 上 正好 与 ALGOL 60 的 故事 相反 。 尽 管 它 的 应 用 远 远 超出 了 其 他 
任何 一 种 程序 设计 语言 ， 但 COBOL 对 后 续 语 言 的 设计 工作 几乎 没有 什么 影响 ， 仅 仅 对 于 PL/I 
语言 是 一 个 例外 。 直 至 今日 ， 它 可 能 仍然 是 最 为 广泛 应 用 的 语言 , ”只 是 这 一 事实 很 难 使 用 任何 
方式 给 以 确认 。COBOL 语 言 对 后 来 的 语言 没有 影响 力 的 最 重要 原因 ， 可 能 是 自 COBOL 语言 出 
现 以 后 ， 就 没有 人 再 试图 设计 一 种 新 的 商务 应 用 语言 。 这 正 是 由 于 COBOL 语言 的 功能 极 好 地 
满足 了 其 应 用 领域 的 需要 。 另 一 个 原因 是 在 过 去 的 20 年 间 ， 商 务 计算 的 大 量 增 长 主要 出 现 于 小 
型 商务 之 中 ， 而 小 型 商务 很 少 开发 计算 机 软件 。 代 之 ， 他 们 所 使 用 的 大 部 分 软件 是 为 各 种 一 般 
商务 目的 而 购买 的 现成 产品 。 


2.6.1 历史 背景 


COBOL 的 起 源 在 某 种 意义 上 与 ALGOL 60 有 些 相 似 ， 即 ， 它 们 都 是 由 一 个 委员 会 在 相对 
短 的 会 议 期 间 所 设计 出 来 的 语言 。 在 1959 年 ， 当 时 的 商务 计算 状况 类 似 于 几 年 以 前 的 科学 计 
算 状况 ， 即 当 Fortran 语 言 还 在 设计 之 中 时 的 状态 。 一 种 编译 式 商 务 应 用 语言 FLOW-MATIC 
已 经 于 1957 年 被 实现 ， 但 这 种 语言 属于 制造 商 UNIVAC， 并 且 它 是 专门 为 这 个 公司 的 计算 机 
而 设计 的 。 另 一 种 是 美国 空军 使 用 的 语言 AIMACO ， 但 这 种 语言 只 是 FLOW-MATIC 的 一 种 变 
种 。IBM 曾 经 为 商务 应 用 设计 了 一 种 程序 设计 语言 ， 称 为 “商务 翻译 ”语言 (COMmercial 
TRANslator，COMTRAN)， 但 在 当时 还 并 没有 被 实现 。 其 他 的 一 些 语言 设计 项 目 也 只 是 还 列 
于 计划 之 中 。 


O 20 世纪 90 年 代 的 后 期 ， 在 一 个 有 关 Y2K 问 题 的 研究 中 ， 人 们 估计 ， 单 是 在 曼哈顿 22 平 方 英 里 的 范围 之 内 ， 大 
约 一 共有 8 亿 行 的 COBOL 程 序 在 使 用 之 中 。 
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2.6.2 FLOW-MATIC 


FLOW-MATIC 语 言 的 起 源 值得 我 们 对 它 作 简短 讨论 ， 因 为 这 种 语言 是 COBOL 语 言 主要 的 
前 区 语言 。1953 年 12 月 ， 在 Remington-Rand UNIVAC 公 司 工 作 的 Grace Hopper， 写 了 一 份 实质 
上 是 预言 性 的 提议 报告 。 这 份 报告 建议 ,“ 数 学 程序 应 该 用 数学 的 标记 方法 来 编写 ， 数 据 处 理 的 
程序 应 该 用 英文 语句 来 编写 ”(Wexelblat，1981，p. 16)。 但 不 幸 的 是 ， 在 1953 年 ， 非 编程 人 员 
不 能 相信 可 以 让 计算 机 理解 英文 。 直 到 1955 年 ， 另 一 份 相似 的 提议 才 有 了 获得 UNIVAC 公 司 管 
理 层 资助 的 一 些 希 望 ， 就 是 到 这 个 时 候 ， 还 是 需要 依靠 一 个 样机 系统 进行 最 后 的 说 服 。 当 时 这 
个 说 服 过 程 包 括 了 编译 与 运行 一 个 小 程序 ， 首 先是 使 用 英文 关键 字 ， 然 后 再 使 用 法 文 关键 字 ， 
最 后 又 使 用 德 文 关 键 字 。 这 个 演示 对 UNIVAC 的 管理 层 印象 深刻 ， 是 使 得 他 们 最 终 接 受 Hopper 
提议 的 主要 因素 。 


2.6.3 COBOL 的 设计 过 程 


由 美国 国防 部 资助 、 以 商务 应 用 的 通用 语言 为 主题 的 第 一 次 正式 会 议 ， 于 1959 年 5 月 28 至 
29 日 在 五 角 大 楼 举行 (正好 是 在 ALGOL 语 言 的 苏黎世 会 议 一 年 之 后 ) 。 会 议 一 致 认为 通用 商务 
语言 ， 当 时 被 命名 为 CBL (Common Business Language)， 应 该 具有 下 面 这 些 一 般 特 性 。 这 种 语 
言 应 该 尽 可 能 多 地 使 用 英语 ， 尽 管 有 个 别人 争辩， 要 采用 更 加 数学 化 的 标记 方法 ， 但 大 部 分 人 
还 是 赞成 应 该 尽 可 能 多 地 使 用 英语 。 这 种 语言 必须 要 易于 使 用 ， 其 至 应 该 不 惜 以 牺牲 一 些 语 言 
功能 为 代价 ， 以 便 加 宽 可 以 运用 计算 机 程序 的 群众 基础 。 这 种 语言 除了 容易 使 用 之 外 ， 当 时 人 
们 还 相信 ， 一 种 使 用 英语 的 语言 会 让 管理 人 员 都 能 够 阅读 程序 。 最 后 ， 在 语言 的 设计 上 ， 不 应 
该 过 分 受 限 于 语言 实现 问题 。 

在 这 个 会 议 上 最 为 关切 的 问题 之 一 是 ， 应 该 尽快 采取 行动 来 创建 这 种 通用 语言 ， 因 为 许多 
创建 新 商务 语言 的 准备 工作 都 已 经 完成 了 。 除 了 当时 已 有 的 语言 之 外 ，RCA 和 Sylvania 都 正在 
创建 他 们 自己 的 商务 应 用 语言 。 很 显然 ， 创 建 这 种 通用 语言 的 过 程 拖 得 越久 ， 这 种 语言 将 更 难 
成 为 广泛 应 用 的 语言 。 基 于 此 ， 会 议 确定 应 该 尽快 地 研究 当时 已 有 的 语言 。 针 对 这 项 任务 ， 成 
并 了 短期 委员 会 (Short Range Committee), 

早期 人 们 决定 ， 将 语言 的 语句 分 为 两 个 种 类 ， 即 数据 描述 类 和 可 执行 操作 类 ， 并 将 分 属于 
这 两 个 种 类 的 语句 分 别 放置 于 程序 的 不 同 部 位 。 短 期 委员 会 的 一 个 重要 议题 是 关于 是 否 包括 下 
标 。 委 员 会 的 许多 成 员 认 为 ， 下 标 对 于 从 事 数 据 处 理 的 人 员 太 过 复杂 ， 因 为 这 些 人 不 习惯 处 理 
数学 标记 。 类 似 的 争论 也 围绕 着 是 否 应 该 在 语言 中 包括 算术 表达 式 。 短 期 委员 会 的 最 后 报告 于 
1959 年 12 月 完成 ， 这 个 报告 中 描述 了 后 来 命名 为 COBOL 60 的 语言 。 

COBOL 60 的 语言 说 明 于 1960 年 4 月 由 政府 印刷 办 公 室 (the Government Printing Office) 出 
版 (Department of Defense，1960)， 这 个 版 本 被 称 为 “初期 版 本 ”。 它 的 两 个 修订 版 本 分 别 于 
1961 年 和 1962 年 出 版 (Department of Defense, 1961, 1962), COBOL 语 言 于 1968 年 由 美国 国家 
标准 协会 (ANSI) 实现 了 标准 化 。 再 后 来 的 COBOL 60 语 言 的 三 个 版 本 分 别 于 1974 年 、 1985 年 
和 2002 年 由 美国 国家 标准 协会 实现 标准 化 。 这 种 语言 一 直 持续 发 展 到 今天 。 


2.6.4 评估 


COBOL 语 言 初 创 了 许多 多 新 的 概念 ， 许 多 概念 后 来 出 现在 其 他 语言 之 中 。 例 如 ，COBOL 
600 的 DEFINE 动 词 是 第 一 种 宏 指令 的 高 级 语言 结构 。 更 为 重要 的 是 ， 最 早出 现 于 Plankalki 语 言 
中 的 层次 数据 结构 首次 被 实现 于 COBOL 语 言 之 中 。 在 这 之 后 所 设计 的 大 多 数 命令 式 语 言 中 ， 都 
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包含 了 这 种 层次 数据 结构 。COBOL 也 是 允许 名 称 真正 具有 含义 的 第 一 种 语言 ， 因 为 它 允 许 长 名 
F (长 达 30 个 字符 ) 以 及 连 字 符 (-)。 

总 体 来 说 ， 数 据 分 区 是 COBOL 语 言 设计 中 的 优势 ， 然 而 它 的 过 程 分 区 则 相对 较 弱 。 每 一 个 
变量 都 在 数据 分 区 中 被 详细 地 定义 ， 其 中 包括 小 数 的 位 数 以 及 蕴涵 的 小 数 点 位 置 。COBOL 语 言 
对 文件 记录 的 擅 述 也 同样 详细 ， 例 如 它 甚 至 定义 了 由 打印 机 输出 的 线条 ， 这 使 得 COBOL 成 为 理 
想 的 财务 报告 打印 语言 。 也 许 COBOL 语 言 早期 的 过 程 分 区 中 最 重大 的 弱点 在 于 它 不 具有 函数 。 
早 于 1974 年 标准 化 之 前 的 COBOL 版 本 也 不 允许 带 参 数 的 子 程序 。 

我 们 对 COBOL 语 言 的 最 后 评价 ; 它 是 第 一 种 由 美国 国防 部 (DoD) 规定 要 求 使 用 的 程序 设计 
语言 。 因 为 COBOL 语 言 不 是 专门 为 美国 国防 部 而 设计 的 ， 所 以 在 它 的 初期 开发 之 后 ， 国 防 部 的 这 
个 规定 随 之 而 来 。 如 果 没 有 这 种 规定 ，COBOL 语 言 尽管 具有 优点 ， 也 许 还 是 不 会 生存 下 来 。 
COBOL 语 言 早 期 编译 器 的 性 能 很 差 ， 这 使 得 它 的 使 用 代价 实在 太 高 。 当 然 ， 人 们 最 终 改 进 了 编译 
器 的 设计 ， 加 之 后 来 计算 机 的 速度 也 更 快 更 便宜 ， 并 且 有 了 大 得 多 的 存储 空间 。 所 有 这 些 因 素 加 
在 一 起 ， 使 得 COBOL 语 言 无 论 是 在 国防 部 之 内 还 是 之 外 ， 都 取得 了 巨大 的 成 功 。COBOL 语言 的 
出 现 ， 导 致 了 商务 处 理 的 电子 自动 化 ， 无 论 从 哪 方 面 ， 这 都 毫 无 疑问 地 是 一 项 意义 重大 的 改革 ， 

下 面 是 COBOL 程 序 的 一 个 例子 。 这 个 程序 读 入 一 个 名 为 BAL-EFWD-FILE 的 文件 ， 这 个 文 
件 包含 多 种 货物 的 库存 信息 。 每 种 货物 的 记录 包括 当前 存货 的 数量 (BAL-ON-HRAND)， 以 及 这 
种 货物 的 临界 记录 点 (BAL-REORDER-POINT)。 当 现存 货物 的 数量 降低 到 这 个 临界 记录 点 时 ， 
束 必 须 征 订 这 种 货物 。 这 个 程序 产生 一 个 必须 再 次 订货 的 货物 清单 ， 这 个 货物 清单 的 文件 名 为 
REORDER-LISTING, 


IDENTIFICATION DIVISION. 
PROGRAM-ID. PRODUCE-REORDER-LISTING. 


ENVIRONMENT DIVISION. 
CONFIGURATION SECTION. 
SOURCE-COMPUTER. DEC-VAX. 
OBJECT-COMPUTER. DEC-VAX. 
INPUT-OUTPUT SECTION. 
FILE-CONTROL. 
SELECT BAL-FWD-FILE ASSIGN TO READER. 
SELECT REORDER-LISTING ASSIGN TO LOCAL-PRINTER. 


DATA DIVISION. 

FILE SECTION. 

FD BAL-FWD-FILE 
LABEL RECORDS ARE STANDARD 
RECORD CONTAINS 80 CHARACTERS. 


01 BAL-FWD-CARD. 


02 BAL-ITEM-NO PICTURE IS 9(5). 
02 BAL-ITEM-DESC PICTURE IS X(20). 
02 FILLER PICTURE IS xX(5). 
02 BAL-UNIT-PRICE PICTURE IS 999V99. 
02 BAL-REORDER-POINT PICTURE IS 9(5). 
02 BAL-ON-HAND PICTURE IS 9(5). 
02 BAL-ON-ORDER PICTURE IS 9(5). 
02 FILLER PICTURE IS X(30). 


FD REORDER-LISTING 
LABEL RECORDS ARE STANDARD 


EPH PRUE HEA 


RECORD CONTAINS 132 CHARACTERS. 


01 REORDER-LINE. 


02 RL-ITEM-NO PICTURE IS 2(5). 
02 FILLER PICTURE IS X(5). 
02 RL-ITEM-DESC PICTURE IS X(20). 
02 FILLER PICTURE IS X(5). 
02 RL-UNIT-PRICE PICTURE IS 222.99. 
02 FILLER PICTURE IS X(5). 
02 RL-AVAILABLE-STOCK PICTURE IS Z(5). 
02 FILLER PICTURE IS X(5). 
02 RL-REORDER-POINT PICTURE IS Z(5). 
02 FILLER PICTURE IS X(71). 


WORKING-STORAGE SECTION. 
01 SWITCHES. 
02 CARD-EOF-SWITCH PICTURE IS X. 
01 WORK-FIELDS. 
02 AVAILABLE-STOCK PICTURE: IS 9(5). 


PROCEDURE DIVISION. 
000-PRODUCE-REORDER-LISTING. 

OPEN INPUT BAL-FWD-FILE. 

OPEN OUTPUT REORDER-LISTING. 

MOVE "N" TO CARD-EOF-SWITCH. 

PERFORM 100-PRODUCE-REORDER-LINE 

UNTIL CARD-EOF-SWITCH IS EQUAL TO "y". 

CLOSE BAL-FWD-FILE. 

CLOSE REORDER-LISTING. 

STOP RUN. 


100-PRODUCE-REORDER-LINE. 
PERFORM 110-READ-INVENTORY-RECORD. 
IF CARD-EOF-SWITCH IS NOT EQUAL TO "y" 
PERFORM 120-CALCULATE-AVAILABLE-STOCK 
IF AVAILABLE-STOCK IS LESS THAN BAL-REORDER-POINT 
PERFORM 130-PRINT-REORDER-LINE. 


110-READ-INVENTORY-RECORD. 
READ BAL-FWD-FILE RECORD 
AT END 
MOVE "Y" TO CARD-EOF-SWITCH. 


120-CALCULATE-AVAILABLE-STOCK. 
ADD BAL-ON-HAND BAL-ON-ORDER 
GIVING AVAILABLE-STOCK. 


130-PRINT-REORDER-LINE. 


MOVE SPACE TO REORDER-LINE. 
MOVE BAL-ITEM-NO TO RL-ITEM-NO. 
MOVE BAL-ITEM-DESC TO RL-ITEM-DESC. 


MOVE BAL-UNIT-PRICE TO RL-UNIT-PRICE. 

MOVE AVAILABLE-STOCK TO RL-AVAILABLE-STOCK. 
MOVE BAL-REORDER-POINT TO RL-~REORDER-POINT. 
WRITE REORDER-LINE. 


N 
We 
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2.7 分 时 操作 的 开始 : BASIC 


BASIC 语 言 (Mather and Waite, 1971) 是 另 一 种 广泛 使 用 的 语言 ， 但 是 却 没 有 得 到 应 有 的 
FE, (COBOL 语言 一 样 ， 它 在 很 大 程度 上 被 计算 机 科学 家 所 忽略 。 也 像 COBOL 语言 一 样 ， 
它 的 早期 版 本 并 不 完美 ， 且 仅仅 包括 了 一 组 极 有 限 的 控制 语句 。 

20 世 纪 70 年 代 后 期 至 80 年 代 初 期 ，BASIC 语言 在 微型 计算 机 上 非常 流行 。 这 直接 源 于 
BASIC 语 言 的 两 个 主要 特征 : 便于 初学 者 掌握 ， 尤其 是 那些 非 科 学 研究 人 员 ， 而且 它 的 小 型 方 
言 可 以 被 实现 在 只 具有 很 小 存储 空间 的 计算 机 上 。 当 微 型 计算 机 的 功能 得 到 增强 并 实现 了 其 他 
各 种 语言 之 后 ，BASIC 语言 的 使 用 ILA. {AGE Visual Basic 语 言 (Microsoft, 1991) 于 20 
世纪 90 年 代 初 期 的 出 现 ，BASIC 语 言 的 应 用 又 复苏 了 。 


2.7.1 设计 过 各 


BASIC (Beginner’s All-purpose Symbolic Instruction Code， 意 为 初学 者 万 用 符号 指令 代码 ) 
语言 是 由 John Kemeny 与 Thomas Kurtz 两 位 数学 家 在 新 罕 布 什 尔 的 Dartmouth 学 院 ( 即 现 在 的 
Dartmouth 大 学 ) 设计 的 。 Kemeny 和 Kurtz 曾 经 于 20 世 纪 60 年 代 初 期 积极 参与 了 为 Fortran 及 
ALGOL 60 的 多 种 方言 创建 编译 器 的 工作 。 当年 他 们 学 院 的 理科 学 生 能 够 在 学 习 期 间 完全 没有 
困难 地 学 习 并 且 使 用 这 些 语言 。 然 而 Dartmouth 主 要 是 一 所 文科 学 院 ， 其 中 的 理工 科学 生 人 数 大 
约 只 占 学 生 总 数 的 25%。 在 1963 年 的 春天 ， 他 们 决定 特别 为 文科 学 生 设 计 一 种 新 的 语言 ， 这 种 
新 语言 将 使 用 计算 机 终端 访问 计算 机 。 这 个 系统 的 目标 为 ， 

它 必 须 让 非 理科 学 生 容易 学 习 与 使 用 。 
: 它 必须 让 人 愉快 且 友 好 。 
. 它 必 须 方便 学 生 的 家 庭 作业 。 
: 它 必须 允许 自由 的 私人 的 访问 。 
: 它 必须 视 用 户 的 时 间 比 计算 机 时 间 更 为 重要 ， 
67 | 最 后 的 这 一 个 目标 的 确 是 一 种 革命 性 观念 。 至 少 部 分 是 缘 于 人 们 相信 计算 机 的 价格 将 随 着 
时 间 变 得 越 来 越 便 宜 ， 事 实 上 的 确 是 如 此 。 
第 二 、 第 三 和 第 四 个 目标 相 结合 ， 导致 BASIC 语言 的 分 时 操作 。 在 20 世 纪 60 年 代 的 初期 ， 
从 能 通过 同时 允许 多 个 用 户 分 别 使 用 终端 访问 计算 机 ， 这 些 目 标 才 能 够 实现 。 
在 1963 年 的 夏天 ， Kemeny 开 始 为 BASIC 语 言 的 第 一 个 版 本 建造 编译 器 。 他 使 用 远程 终端 访 
回 一 台 GE225 型 计算 机 。 设计 和 编写 BASIC 的 操作 系统 的 工作 始 于 1963 年 的 秋天 ， 1964 年 5 月 1 
日 早上 4 点 ， 使 用 分 时 操作 的 BASIC 语言 的 第 一 个 程序 被 键入 终端 并 且 开 始 运 行 。 到 6 月 份 ， 系 
统 上 终端 机 的 数目 增长 到 11 台 ， 而 到 秋天 之 前 又 增加 到 了 20 台 。 


2.7.2 语言 概述 


BASIC 语 言 的 最 初版 本 非常 小 ， 而 且 十 分 奇怪 地 ， 它 不 是 交互 式 的 ， 即 不 具有 从 终端 输入 数据 
的 方法 。 从 殴 和 程序， 编译 程序 ， 然 后 到 运行 程序 ， 所 有 的 这 一 切 都 是 以 一 种 所 谓 “ 批 处 理 ” 方式 
(batch-oriented) 来 进行 。 这 个 最 初 的 版 本 只 有 14 种 不 同 的 语句 类 型 ， 并 且 仅 仅 具 有 一 种 浮 点 数据 类 
型 。 因 为 当时 人 们 相信 ， 很 少 会 有 用 户 需要 区 别 整数 与 浮 点 数 这 两 各 不同 的 数据 类 型 ，BASIC 语 言 、 
将 这 些 类 型 笼统 地 称 为 “数字 "。 总 而 言 之 ， 它 是 一 种 相当 容易 学 习 但 局 限 性 很 大 的 语言 N 


2.7.3 评估 | 
早期 BASIC 最 重要 的 方面 是 ， 它 古 第 一 种 使 用 远程 终端 访问 计算 机 的 广 为 应 用 的 语 


— 


nm A U N 


A. C 当时 终端 机 才刚 刚 开 始 出 现 ， 而 在 此 之 前 的 大 多 数 程序 ， 都 是 经 过 穿孔 卡片 或 者 纸 市 输 
入 计算 机 。 

BASIC 语 言 中 的 大 部 分 设计 都 来 自 于 Fortran 语 言 ， 也 受到 ALGOL 60 语 言语 法 的 些微 影 啊 。 

来 ，BASIC 语 言 的 各 个 方面 都 在 发 展 ， ARE MARA RAIN LAE, 
国家 标准 协会 发 行 iT “最 基本 BASIC 语 言 的 标准 ”(Minimal BASIC standard) (ANSI, 1978b), 4X 
仅 代表 了 BASIC 语 言 很 少 的 最 基本 特性 。 而 在 事实 上 ， 早 期 BASIC 版 本 与 这 个 基本 标准 非常 相似 。 

信人 吃惊 的 是 ， pean (Digital Equipment Corporation) 于 20 世 纪 70 年 代 中 期 使 用 
BASIC 语 言 的 一 种 名 为 BASIC-PLUS 的 加 强 版 本 ， 编 写 了 用 于 PDP-11 型 微型 计算 机 的 最 大 操作 
系统 RSTS 中 的 重要 部 分 。 

BASIC 语 言 在 许多 方面 遭 到 了 批评 ， 其 一 是 因为 用 它 编写 的 程序 结构 很 差 。 根 据 第 1 章 讨 论 
的 评估 标准 ， 特 别 是 可 读 性 和 可 靠 性 ，BASIC 语 言 的 确 非 党 糟糕。 十 分 明显 的 是 ，BASIC 语 言 
的 早期 版 本 不 是 设计 用 来 (也 不 应 该 ) 编写 任何 大 型 的 重要 程序 。 后 来 的 版 本 才 比 较 适 合 这 样 
的 工作 ， 

20 世 纪 90 年 代 Visual BASIC (VB) 的 出 现 复活 了 BASIC 语 言 。VB 在 各 种 领域 广泛 使 用 ， 
因为 它 能 够 为 构建 图 形 用 户 接口 (GUI) 提供 一 种 简单 的 方式 ， tied £04 Visual BASIC, 
Visual Basic.NET (简称 为 VB.NET) 是 微软 公司 的 NET 系列 语言 中 的 一 种 。 尽 管 这 种 语言 与 
Visual Basic 语 言 非常 不 同 ， 但 很 可 能 就 在 今后 的 几 年 中 ，Visual Basic.NET 将 赫 代 较 老 的 Visual 
Basic (简称 为 VB 语言 )。VB 与 VB dd er ek E 在 于 VB.NET 语 言 全 面 支持 面 癌 
对 象 的 程序 设计 。VB 语 言 原来 的 用 户 很 可 能 不 会 学 习 VB.NET 语 言 ， 而 是 转移 到 另 一 种 语言 如 C# 
(参见 第 2.19 小 市 )， 尤 其 是 因为 所 有 的 .NET 语 Aertel Passe (GUI), 

下 面 是 BASIC 程 序 的 一 个 例子 : 


REM BASIC Example Program 
REM Input: An integer, listlen, where listlen is less 


REM than 100, followed by listlen-integer values 
REM Output: The number of input values that are greater 
REM than the average of all input values 


DIM intlist(99) 

result = 0 

sum = 0 

INPUT listlen 

IF listlen > 0 AND listlen < 100 THEN 


REM Read input into an:array and compute the sum 
FOR counter = 1 TO listlen 
INPUT intlist(counter) 
sum = sum + intlist(counter) 
NEXT counter 
REM Compute the average 
average = sum / listlen 
REM Count the number of input values that are > average 
FOR counter = 1 TO listlen 
IF intlist(counter) > average 
THEN result = result + 1 
NEXT counter 
REM Print the result 
PRINT "The number of values that are > average is:"; 


O LISP 最 初 用 于 终端 ， 但 在 20 世 纪 60 年 代 早 期 没有 得 到 广泛 使 用 。 
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result 
ELSE 
PRINT "Error—input list length is not legal" 
END IF 
END 


访谈 用户 设 计 与 语言 设计 





ALAN COOPER 

Alan Cooper 是 畅销 书 About Face: The Essentials of User Interface Design} (E% , 
在 设计 Visual Basic 这 种 宣称 最 注重 用 户 界面 设计 的 语言 中 也 不 乏 他 的 大 手笔 。 对 于 
他 而 言 ， 这 一 切 都 来 自 于 技术 人 性 化 的 观点 。 





背景 信息 

IF]: 你 是 如 何 开始 现在 所 从 事 的 这 一 切 的 ? 

E: 我 曾经 从 高 中 退学 ， 后 来 获取 了 加 州 社区 大 专 的 程序 设计 专业 学 位 。 我 的 第 一 份 工作 是 在 位 于 
旧金山 的 American President Lines 公司 (美国 最 老 的 海洋 运输 公司 之 一 ) 作 程 序 员 。 除 了 或 这 儿 或 那儿 工 
作 几 个 月 以 外 ， 我 基本 上 都 是 一 个 “个 体 户 ”。 

Al: 你 现在 的 工作 是 什么 ? 

E: 是 从 事 技术 人 性 化 工作 的 Cooper 公 司 的 创始 人 ， 并 在 公司 担任 主席 职务 。 

Al: 你 最 喜爱 的 工作 是 什么 ? 

E: 界面 设计 方面 的 咨询 工作 。 

Al: 你 在 语言 设计 以 及 用 户 界 面 设计 领域 非常 有 名 。 在 关于 设计 语言 或 设计 软件 或 者 设计 其 他 任何 
东西 方面 ， 你 有 什么 样 的 想法 ? 

E: 在 软件 世界 里 基本 上 都 是 一 样 的 ， 即 了 解 你 的 用 户 。 

关于 早期 的 视窗 (WINDOWS) 系统 

[A]: 早 在 20 世 纪 80 年 代 你 就 开始 使 用 视窗 操作 系统 ， 并 曾经 谈 到 过 你 被 视窗 的 特点 所 吸引 ， 它 对 于 
图 形 用 户 界 面 的 支持 ， 程 序 库 的 动态 链接 ， 这 些 使 得 你 创造 了 让 它们 配置 自身 的 工具 。 最 终 ， 你 帮助 建造 
了 视窗 的 哪些 部 分 ? 

E: 微软 在 视窗 系统 中 包括 进 实际 意义 的 多 任务 支持 ， 给 我 十 分 深刻 的 印象 。 这 里 包括 了 动态 地 址 
重新 分 配 以 及 进程 间 通 信 。MSDOS .exe 是 最 初 几 次 视窗 发 行 时 的 壳 程 序 。 这 是 一 个 很 糟糕 的 程序 ， 我 当 
时 相信 还 可 以 对 这 个 程序 作 巨 大 的 改进 ， 我 就 进行 了 这 项 工作 。 当时 我 用 业余 时 间 开 始 编写 比 视窗 随 带 的 
元 程序 更 好 的 一 个 壳 程 序 。 我 将 这 个 程序 称 为 “三 脚 架 ”(Tripod)。 微软 公司 原来 的 过 程序 MSDOS .exe 曾 
经 是 阻碍 视窗 初期 成 功 的 一 个 主要 绊脚石 。 而 “三 脚 架 ” 通过 更 容易 使 用 和 配置 来 企图 解决 存在 的 问题 。 

问 : 哪个 时 刻 是 你 灵感 来 临 的 时 刻 ? 

答 : 是 1987 年 的 后 期 ， 当 我 正 与 一 个 公司 的 顾客 面谈 时 ， 关 于 “三 脚 架 ” 设计 的 关键 性 策略 突然 跳 入 
了 我 的 脑海 。 当 时 这 个 IS 的 经 理 向 我 解释 ， 他 需要 为 他 的 各 类 用 户 建立 并 发 行 一 个 范围 很 广 的 过 解决 方案 。 
我 意识 到 这 里 的 谜底 是 ， 根 本 就 不 存在 一 个 十 全 十 美的 壳 。 每 一 个 用 户 都 要 有 他 自 己 个 性 化 的 、 适 合 自己 
需要 以 及 技能 水 平 的 这。 即刻 ， 我 构思 了 过 设计 问题 的 解决 方案 : 它 是 过 结构 的 一 个 集合 ， 它 是 一 个 工具 ， 
而 每 一 个 用 户 都 能 够 根据 他 或 她 的 应 用 课题 以 及 训练 程度 的 独特 组 合 ， 使 用 这 个 工具 来 构造 符合 需求 的 壳 。 

IF): 为 什么 个 性 化 壳 的 思想 如 此 吸引 人 ? 

E: 不 是 由 我 来 告诉 用 户 什么 是 理想 的 壳 ， 他 们 可 以 自己 设计 个 性 化 的 理想 的 壳 。 使 用 这 种 量 体 裁 
衣 的 充 结 构 ， 一 个 程序 员 可 以 创造 出 一 个 功能 强大 并 且 适 用 广泛 ， 当然 也 具有 某 种 危险 性 的 壳 来， 然而 ， 
一 个 IT 经 理 则 可 以 为 一 个 文秘 职员 专门 创建 仅 包 含 适合 该 职 员 需 要 的 特定 应 用 工具 的 壳 。 


ERE RA EIR 47 


问 : 你 是 怎么 从 编写 壳 程 序 到 与 微软 公司 合作 的 ? 

答 :“ 三 脚 架 ” 与 “红宝石 ”是 同一 个 程序 。 在 我 与 比尔 盖 次 签署 了 合同 之 后 ， 我 将 样机 的 名 称 从 
三脚 架 ” 改 为 “红宝石 ”。 然 后 ， 我 以 样机 应 有 的 使 用 方式 来 运用 “红宝石 ”样机 : 一 个 用 于 构造 发 布 级 
质量 代码 的 先行 模型 。 这 就 是 我 当时 所 完成 的 工作 。 微 软 公 司 取得 “红宝石 ”的 发 布 版 本 ， 并 将 其 与 
QuickBASIC 标 合 起 来 就 产生 了 VB。 这 中 间 所 有 的 原始 革新 都 包含 在 “三 脚 架 /“ 红 宝石 ”里 面 。 

“红宝石 ”作为 VISUAL BASICAY MEL S 

A): 让 我 们 重新 谈 一 谈 你 对 早期 的 视窗 系统 及 其 动态 链接 库 (DLL) 特性 的 兴趣 。 

Z: DLL 并 不 是 独立 的 ， 它 只 是 操作 系统 中 的 一 项 工具 。 这 个 工具 允许 程序 人 员 构 造 代码 对 象 ， 并 且 
能 够 在 运行 时 实现 链接 ， 而 不 是 在 编译 时 链接 。 正 是 这 种 特性 允许 我 创造 了 VB 语言 中 可 动态 扩展 的 部 分 ， 
这 一 部 分 就 连作 为 第 三 者 的 卖方 也 可 以 施加 控制 。 

“ECA” ”产品 促成 了 软件 设计 中 的 许多 重大 进步 ， 其 中 两 项 更 是 空前 成 功 。 如 我 曾经 提 到 的 ， 视 窗 
系统 的 动态 链接 功能 当时 时 刻 在 激励 着 我 ， 但 是 具有 一 些 工 具 和 知道 如 何 运 用 它们 却 是 完全 不 同 的 两 件 事 
情 。 有 了 “红宝石 ， 我 最 终 找 到 了 两 种 动态 链接 的 实际 使 用 ， 初 期 的 “红宝石 ”程序 就 包括 了 这 两 种 使 
用 。 首 先 ， 这 种 语言 是 可 安装 的 ， 并 且 能 够 被 动态 地 扩展 。 第 二 ， 新 发 明 的 模块 能 够 动态 地 加 入 其 中 。 

A): 你 的 “红军 石 ” 是 不 是 最 早 具 有 动态 链接 库 并 且 被 链接 到 一 个 可 视 化 前 端的 ? 

答 : 就 我 所 知 ， 是 的 。 

H: 请 用 一 个 简单 例子 说 明 ， 这 些 能 够 让 一 个 程序 员 对 他 或 她 的 程序 做 些 什么 ? 

答 : 从 第 三 方 购买 一 个 控件 ， 例 如 一 个 网 格 控件 ， 将 这 个 控件 安装 到 他 或 她 的 计算 机 上 ， 并 使 得 这 
个 网 格 控件 看 上 去 像 是 该 语言 的 一 个 组 成 部 分 ， 包 括 可 视 化 程序 设计 前 端 。 

A): 为 什么 人 们 称 你 为 “Visual Basic 之 父 ”? 

B: “红宝石 ”伴随 着 一 种 小 型 语言 ， 这 种 语言 适合 执行 壳 程 序 所 需要 的 十 来 条 或 者 极为 简单 的 指令 。 
然而 ， 这 种 语言 被 作为 DLL 链 来 实现 ， 而 任意 数目 的 DLL 都 可 以 在 运行 时 装载 。 计 算 机 内 部 的 语法 分 析 器 
可 以 识别 一 个 动词 ， 并 将 这 个 动词 沿 着 DLL 的 链 传递 ， 直 到 链 上 某 个 环节 表示 知道 如 何 处 理 为 止 。 如 果 这 
个 动词 通过 了 整个 DLL 链 ， 则 存在 着 一 个 语法 错误 。 从 我 与 微软 公司 的 早期 讨论 ， 我 们 双方 都 赞同 扩展 这 
种 语言 的 主意 ， 也 可 能 ， 其 至 会 用 一 种 “真实 ”的 语言 来 完全 替代 它 。C 是 经 常 被 提 及 的 候选 语言 ， 然 而 
微软 最 终 利 用 这 种 动态 接口 拆卸 下 我 们 的 小 型 帝 语 言 ， 并 用 QuickBasic 语 言 整体 取代 了 这 种 壳 语 言 。 这 种 
语言 与 可 视 化 前 端的 新 型 结合 是 静态 与 固定 的 。 而 且 , 尽管 正 是 原始 的 动态 接口 才 使 得 这 种 结合 成 为 可 能 ， 
但 原始 部 分 在 这 个 过 程 中 被 遗弃 。 

关于 新 思想 的 最 后 几 句 话 

H: 在 程序 设计 以 及 程序 设计 工具 领域 里 ， 也 包括 语言 与 环境 ， 哪 一 个 项 目 让 你 最 感 兴 趣 ? 

E: 我 感 兴趣 的 是 创造 程序 设计 工具 ， 这 些 工具 主要 设计 用 来 帮助 用 户 而 不 是 程序 人 员 。 

IF]: 让 你 谨 记 在 心 的 重要 法 则 、 著 名 语录 或 者 设计 思想 是 什么 ? 

E: 桥梁 是 由 钢铁 工人 建造 的 ， 而 不 是 由 工程 师 建造 的 。 

同样 地 ， 软 件 是 由 程序 人 员 编 写 的 ， 而 不 是 由 工程 师 编写 的 。 





28 ”用途 广泛 的 语言 : PL/l 


PLI 代表 了 第 一 次 大 规模 的 尝试 ， 人 们 尝试 设计 一 种 适用 于 应 用 范围 广泛 的 语言 。 所 有 在 
此 之 前 以 及 大 多 数 在 此 之 后 设计 的 语言 ， 都 将 重心 集中 于 某 一 特殊 的 应 用 领域 ， 例 如 ， 科 学 应 
用 、 人 工 智能 或 者 商务 应 用 。 


2.8.1 历史 背景 
与 Fortran 语 言 一 样 ，PL/I 是 作为 IBM 的 一 项 产品 被 开发 的 。 早 在 20 世 纪 60 年 代 的 初期 ， 工 
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业界 中 的 计算 机 用 户 就 被 分 为 两 个 相互 独立 而 又 相当 不 同 的 阵营 。 以 IBM 的 观点 ， 从 事 科学 计 
算 的 程序 人 员 可 以 使 用 [BM 的 7090 大 型 计算 机 或 者 1620 小 型 计算 机 。 正 是 这 一 部 分 人 员 ， 极 大 
量 地 使 用 浮 点 数据 类 型 和 数组 。 他 们 使 用 的 主要 语言 是 Fortran， 但 也 使 用 一 些 汇编 语言 。 他 们 
有 着 自己 的 用 户 团体 SHARE， 而 且 他 们 与 工作 于 商务 应 用 领域 的 人 员 极 少 联系 。 

对 于 商务 应 用 ， 人 们 使 用 [BM 的 7080 大 型 计算 机 或 者 1401 小 型 计算 机 。 他 们 需要 十 进 制 及 
字符 串 数据 类 型 ， 也 需要 精细 和 高 效 的 输入 及 输出 设施 。 他 们 使 用 COBOL 语 言 。 尽 管 在 1963 年 
的 初期 关于 PL/I 语 言 的 故事 才刚 刚 开 始 ， 而 那 时 从 汇编 语言 到 COBOL 的 转换 还 远 没 有 完成 ， 
他 们 却 已 经 使 用 了 COBOL。 这 种 类 型 的 用 户 也 有 自己 的 用 户 团体 GUIDE， 并 且 他 们 也 很 少 与 科 
学 计算 类 型 的 用 户 联 系 。 

在 1963 年 初 ， IBM 的 规划 人 员 感 觉 到 这 种 情况 在 开始 变化 ， 这 两 个 互相 远离 的 计算 机 用 户 团 
体 正在 向 彼此 靠近 的 方向 移动 。IBM 的 人 员 认 为 这 必定 会 产生 问题 。 当 时 ， 科 学 家 们 已 经 开始 采 
集 大 型 文件 数据 来 进行 处 理 ， 这 些 数据 需要 更 复杂 更 高 效 的 输入 输出 设施 。 而 商务 应 用 的 人 们 开 
始 应 用 回归 分 析 来 建立 信息 管理 系统 ， 其 中 需要 使 用 浮 点 数据 和 数组 。 这 开始 显示 ， 很 快 人 们 会 
需要 两 台 不 同 的 计算 机 以 及 不 同 的 技术 人 员 来 进行 计算 装载 工作 ， 以 便 支 持 两 种 非常 不 同 的 程序 
设计 语言 。” 

这 种 感觉 十 分 自然 地 导致 人 们 想 要 设计 一 种 通用 计算 机 的 想法 ， 这 种 计算 机 应 兼 有 浮 点 数 
运算 以 及 十 进 制 算 术 运 算 的 能 力 ， 因 而 能 够 同时 实施 科学 应 用 以 及 商务 应 用 。IBM System/360 系 
列 计算 机 的 原理 就 由 此 而 诞生 。 随 之 而 来 的 想法 便 是 ， 需 要 一 种 能 够 兼用 于 科学 以 及 商务 应 用 
的 程序 设计 语言 。 作 为 锦上添花 ， 这 种 语言 还 增添 了 系统 程序 设计 和 表 处 理 的 语言 特性 。 因 此 ， 
这 样 的 新 语言 被 计划 用 来 替代 Fortran、COBOL、LISP， 以 及 汇编 语言 的 系统 应 用 。 


2.8.2 设计 过 程 


语言 的 设计 工作 开始 于 1963 年 10 月 ， 当 时 IBM 和 SHARE RLT “SHARE Fortran 项 目的 
高 级 语言 开发 委员 会 ”(the Advanced Language Development Committee of the SHARE Fortran 
Froject) 。 这 个 新 委员 会 的 成 员 很 快 磁头， 并 成 立 了 一 个 被 称 为 3x3 委员 会 的 子 委 员 会 ， 之 所 
以 这 样 命名 ， 是 因为 它 的 三 个 成 员 来 自 于 IJBM， 而 另外 三 个 成 员 来 自 于 SHARE, 3x3 委员 会 
每 隔 一 个 星期 开会 三 天 或 四 天 ， 来 设计 新 的 语言 。 

束 像 COBOL 的 短期 委员 会 一 样 ， 他 们 要 在 相当 短 的 时 间 内 完成 初步 的 语言 设计 。 显 然 在 20 
世纪 60 年 代 初 期 盛行 的 观念 是 ， 不 论 这 种 语言 设计 的 工作 量 如 何 ， 都 可 以 在 三 个 月 之 内 完成 。 
PL/I 语 言 的 第 一 个 版 本 (当时 被 命名 为 Fortran VI) 原 定 于 子 委员 会 成 立 之 后 不 到 三 个 月 的 时 间 
即 12 月 前 完成 。 委 员 会 成 功 地 申请 了 延期 ， 将 完成 时 间 推 移 到 了 1 月 份 ， 进而 又 再 次 推移 到 了 
1964 年 2 月 的 下 旬 。 

在 最 初 的 设计 构想 中 ， 新 语言 将 是 Fortran IV 的 一 种 扩展 ， 以 便 维持 语言 的 兼容 性 。 但 很 快 ， 
这 个 目标 连同 名 字 Fortran VI 一 起 被 弃 用 。 到 1965 年 之 前 ， 这 种 语言 一 直 被 称 为 NPL 产 于 英文 
新 程序 设计 语言 ”(New Programming Language) 的 首 字 母 组 合 。 NPL 语 言 的 第 一 次 发 布 报告 
于 1964 年 3 月 在 SHARE 会 议 上 公布 。 接 着 在 4 月 份 ， 发 表 了 NPL 语言 的 比较 完整 的 描述 ， 而 它 
的 能 够 被 实际 实现 的 版 本 于 1964 年 12 月 由 英国 的 IBM Hursley 实 验 室 的 编译 器 工作 组 发 表 (IBM ， 
1964)。 该 工作 组 专门 进行 这 种 语言 的 实现 工作 。 NPL 语 言 的 名 字 在 1965 年 被 改 为 PLII， 以 免 与 
英国 国家 物理 实验 室 (National Physical Laboratory, NPL) 的 名 字 相 混淆 假如 PL/I 的 编译 器 


O 同 时 ， 大 型 计算 机 设备 需要 专门 的 硬件 和 专门 的 系统 软件 维护 人 员 。 


是 在 英国 之 外 开发 的 ， 它 的 名 字 可 能 会 保持 为 NPL。 
2.8.3 语言 概述 


朱 述 PLV 语 言 最 为 贴切 的 一 句 话 也 许 是 ， 它 包括 了 下 列 这 些 语言 中 当时 被 认为 最 优秀 的 部 
分 : ALGOL 60 的 “递归 与 块 结构 ”"、Fortran IV 的 “通过 全 局 数据 来 分 开 编译 与 通信 ”， 以 及 
COBOL 60 的 “数据 结构 、 输 入 /输出 以 及 生成 报告 的 设施 ”， 还 包括 一 系列 相当 多 的 新 结构 ， 并 
将 所 有 这 些 部 分 粮 合 在 一 起 。 因 为 PL/I 现在 几乎 是 已 经 死去 的 语言 ， 所 以 我 们 不 会 哪怕 只 以 简 
略 的 方式 来 讨论 这 种 语言 的 所 有 特性 ， 或 者 它 的 最 具 争 议 的 结构 。 我 们 只 是 简要 地 概括 这 种 语 
言 对 于 程序 设计 语言 知识 库 的 一 些 贡献 。 

PL/I 是 第 一 种 具有 下 列 设施 的 程序 设计 语言 : 

* 允许 程序 产生 并 发 执行 的 子 程序 。 这 虽然 是 一 个 好 主意 ， 但 是 这 种 功能 在 PL/I 中 的 开发 

却 很 差 。 

。 可 以 发 现 并 处 理 23 种 不 同 种 类 的 异常 或 运行 时 错误 。 

。 克 许 子 程序 递归 ， 但 为 了 便于 非 递 归 子 程序 高 效率 地 链接 ， 也 可 以 停止 递归 功能 。 

。 指 针 被 作为 一 种 数据 类 型 。 

“可 以 单独 引用 数组 的 横向 部 分 。 例 如 ， 可 以 将 矩阵 的 第 三 行 作为 一 个 矢量 来 引用 。 


2.8.4 评估 


任何 对 于 PL/VI 语 言 的 评估 ， 必 须 从 认识 这 项 设计 工作 的 勃勃 雄心 开始 。 现 在 来 看 ， 当 时 认 
为 这 人 么 多 的 结构 可 以 成 功 地 结合 起 来 显然 是 过 于 和 天真。 但 在 回顾 这 段 历史 时 ， 我 们 必须 认识 到 ， 
当时 人 们 还 没有 多 少 语言 设计 的 经 验 。 总 而 言 之 ，PL/I 语 言 设计 的 前 提 ， 是 要 包括 进 任何 有 用 
的 、 并 可 以 实现 的 语言 结构 ， 但 没有 充分 意识 到 ， 当 将 这 么 多 的 语言 特性 绑 在 一 起 时 ， 将 会 出 
现 什么 样 的 行为 。Edsger Dijkstra 在 他 的 图 灵 奖 讲座 (Turing Award Lecture) (Dijkstra, 1972) 
中 ， 对 PL/I 语言 的 复杂 性 做 出 了 最 为 激烈 的 批评 : “我 绝对 无 法 预见 ， 当 程序 设计 语言 一 一 请 
注意 ， 这 是 我 们 的 基本 工具 一 一 已 经 超出 了 我 们 的 智力 控制 范围 时 ， 我 们 如 何 能 够 仍然 牢固 地 、 
将 不 断 增长 的 程序 置 于 我 们 的 智力 掌握 之 下 。” 

除了 由 于 过 于 庞大 的 规模 所 引起 的 语言 复杂 性 问题 之 外 ，PL/I 还 有 许多 现在 被 认为 是 设计 
得 极 差 的 结构 ， 其 中 有 指针 结构 、 异 常 处 理 与 并 发 性 ， 虽 然 我 们 必须 指出 ， 这 里 所 列举 的 每 一 
种 结构 从 来 没有 在 前 面 的 语言 中 出 现 过 。 

束 语 言 的 应 用 方面 而 言 ，PL/I 至 少 应 该 被 看 作 是 部 分 成 功 的 。 它 于 20 世 纪 70 年 代 被 大 量 地 
运用 于 商务 和 科学 应 用 中 。 这 期 间 ， 它 的 几 种 子 语 言 也 被 作为 教学 语言 广泛 运用 ， 如 PL/C 语 言 
(Cornell, 1977) 和 PL/CS 语 言 (Conway and Constable, 1976), 

下 面 古 PL/I 程 序 的 一 个 例子 


/* PL/I PROGRAM EXAMPLE 
INPUT: AN INTEGER, LISTLEN, WHERE LISTLEN IS LESS THAN 
100, FOLLOWED BY LISTLEN-INTEGER VALUES 
OUTPUT: THE NUMBER OF INPUT VALUES THAT ARE GREATER THAN 
THE AVERAGE OF ALL INPUT VALUES * / 
PLIEX: PROCEDURE OPTIONS (MAIN); 
DECLARE INTLIST (1:99) FIXED. 
DECLARE (LISTLEN, COUNTER, SUM, AVERAGE, RESULT) FIXED; 
SUM = 0; 
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RESULT = 0; 
GET LIST (LISTLEN); 
IF (LISTLEN > 0) & (LISTLEN < 100) THEN 


DO; 
/* READ INPUT DATA INTO AN ARRAY AND COMPUTE THE SUM */ 
DO COUNTER = 1 TO LISTLEN; 
GET LIST (INTLIST (COUNTER) ); 
SUM = SUM + INTLIST (COUNTER); 
END; 
/* COMPUTE THE AVERAGE */ 
AVERAGE = SUM / LISTLEN; 
/* COUNT THE NUMBER OF VALUES THAT ARE > AVERAGE */ 
DO COUNTER = 1 TO LISTLEN; 
IF INTLIST (COUNTER) > AVERAGE THEN 
RESULT = RESULT + 1; 
END; 
/* PRINT RESULT */ 
PUT SKIP LIST ('THE NUMBER OF VALUES > AVERAGE IS:'); 
PUT LIST (RESULT); 
END; 
ELSE 
PUT SKIP LIST ('ERROR—INPUT LIST LENGTH IS ILLEGAL'); 


END PLIEX; 


2.9 两 种 早期 的 动态 语言 ， APL 和 SNOBOL 


本 市 的 结构 将 不 同 于 本 章 中 的 其 他 各 小 节 ， 因 为 在 这 里 讨论 的 语言 与 其 他 的 语言 非常 不 同 。 
APL 与 SNOBOL 都 没有 基于 任何 已 经 存在 的 语言 ， 而 且 这 两 种 语言 对 以 后 的 主流 语言 都 没有 多 
少 影响 。“ 我 们 将 在 本 书 的 后 面 介绍 APL 的 一 些 有 趣 的 语言 特性 。 

在 语言 的 外 观 和 语言 的 目的 这 两 方面 ，APL 与 SNOBOL 非常 不 同 ， 但 是 它们 却 共 同 享有 两 
种 基本 特征 : 动态 类 型 化 和 动态 存储 空间 分 配 。 这 两 种 语言 中 的 变量 基本 上 不 具有 类 型 。 当 
赋值 给 一 个 变量 时 ， 该 变量 就 获得 一 个 类 型 ， 这 时 它 即 承接 所 赋 数 值 的 类 型 。 仅 仅 当 一 个 变 
量 被 赋值 时 ， 才 将 存储 空间 分 配给 这 个 变量 ， 因 为 在 此 之 前 无 法 知道 这 个 变量 所 需要 的 存储 
空间 大 小 。 


2.9.1 APL 的 起 源 与 特征 


APL (Brown etal., 1988) 是 由 IBM 的 Kenneth E. Iverson 于 1960 年 的 前 后 设计 的 。 最 初 的 计 
划 并 不 是 将 它 设计 成 为 一 种 可 实现 的 程序 设计 语言 ， 而 是 想 要 设计 成 一 种 用 来 描述 计算 机 体系 
结构 的 工具 。 关 于 APL 的 首次 描述 ， 发 表 在 一 本 名 为 A Programming Language (Iverson, 1962) 
的 书 中 ， 它 正 是 因为 这 本 书 而 得 名 。 AFL 的 第 一 次 实现 是 于 20 世 纪 60 年 代 中 期 在 IBM 开 发 的 。 

APL 具 有 大 量 功 能 强大 的 操作 符 ， 这 给 语言 的 实现 人 员 带 来 了 一 个 问题 。 使 用 APL 的 第 一 
种 方法 是 通过 IBM 的 打印 终端 。 这 些 打印 终端 具有 一 些 特殊 的 印刷 球 ， 来 提供 这 种 语言 所 要 求 
的 特殊 字符 集合 。APL 语 言 具有 这 么 多 操作 符 的 一 个 原因 ， 是 它 允 许 像 操纵 一 个 单位 一 样 来 操 
纵 数组 。 例 如 ， 可 以 通过 一 个 操作 符 来 完成 任意 矩阵 的 转 置 运算 。 尽管 这 些 庞大 的 操作 符 系 列 
提供 了 极 高 的 语言 表达 力 ， 但 APL 的 程序 难于 阅读 。 这 使 得 有 些 人 认为 ， 最 好 是 用 APL 来 进行 
一 次 性 ”的 程序 设计 。 尽 管 使 用 它 编写 程序 很 快 ， 但 由 于 这 些 程 序 十 分 难以 维护 ， 因 而 使 用 之 


O 然而， 它们 对 非 主流 语言 有 影响 (J 语言 是 基于 APL，ICON 语 言 是 基于 SNOBOL， AWK 语 言 部 分 基于 
SNOBOL ) 。 


后 应 该 丢弃 。 
APL 已 经 生存 了 40 年 ， 尽 管 它 的 应 用 不 广泛 ， 但 今天 仍然 还 在 使 用 之 中 。 此 外 ， 自 APL 产 


生 以 来 ， 它 没有 经 过 大 的 修改 。 
2.9.2 SNOBOL 的 起 源 与 特征 


SNOBOL (RFA “snowball”) (Griswold et al., 1971) 语言 是 于 20 世 纪 60 年 代 初 期 由 贝 
尔 实验 室 的 三 个 工作 人 员 所 设计 的 。 他 们 是 D.J.Farber、R.E.Griswold 和 F.P. Polensky (Farber et 
al.，1964)。 它 是 专门 为 文本 处 理 而 设计 的 语言 。SNOBOL 语 言 的 核心 是 一 系列 用 于 字符 串 模 式 
匹配 的 功能 强大 的 操作 符 。SNOBOL 的 早期 应 用 之 一 是 编写 文本 编辑 器 。 因 为 SNOBOL 的 动 
态 特征 ， 使 得 它 比 其 他 一 些 语言 的 速度 要 慢 ， 现 在 已 经 不 再 使 用 这 种 类 型 的 程序 。 然 而 
SNOBOL 仍然 是 具有 生命 力 且 得 到 支持 的 语言 ， 它 被 用 于 许多 不 同 的 应 用 领域 ， 完 成 各 种 各 样 
的 文本 处 理 任务 。 


2.10 数据 抽象 的 开始 : SIMULA 67 


虽然 SIMULA 67 从 未 得 到 广泛 应 用 ， 并 对 当时 的 计算 界 以 及 程序 人 员 影 响 甚 微 ， 但 是 它 所 
引入 的 一 些 概念 ， 却 使 得 它 成 为 一 种 具有 重要 历史 意义 的 语言 。 


2.10.1 设计 过 程 


1962 年 至 1964 年 间 ， 两 个 挪威 人 Kristen Nygaard 和 Ole-Johan Dahl, 在 挪威 计算 中 心 
(NCC) 共同 开发 了 SIMULA I 语言 。 他 们 的 主要 兴趣 是 使 用 计算 机 进行 模拟 ,但 也 进行 操作 系 
统 方面 的 研究 。SIMULA I 完全 是 为 系统 模拟 而 设计 的 ， 于 1964 年 下 半年 首先 在 一 台 UNIVAC 
1107 计算 机 上 实现 。 

WTE SIMULA I 语言 实现 完成 之 后 ，Nygaard 和 Dahl 很 快 开始 了 语言 的 扩展 工作 : 增加 一 些 
新 的 语言 特性 以 及 修改 一 些 已 有 的 语言 结构 ， 以 便 SIMULA I 能 够 适用 于 一 般 应 用 。 这 项 工作 的 
结果 导致 了 SIMULA 67 语 言 的 诞生 。SIMULA 67 的 设计 于 1967 年 3 月 首次 被 公开 发 表 (Dahl and 
Nygaard，1967)。 尽 管 我 们 所 感 兴趣 的 一 些 SIMULA 67 语 言 特性 也 出 现 于 SIMULA I 之 中 ， 但 我 
们 将 仅 讨 论 SIMULA 67 语 言 。 


2.10.2 语言 概述 


SIMULA 67 古 ALGOL 60 语 言 的 一 种 扩展 ， 它 采纳 了 ALGOL 60 中 的 两 种 结构 : 块 结构 与 控 
制 语句 结构 。ALGOL 60 (以 及 当时 的 其 他 各 种 语言 ) 用 于 模拟 时 的 主要 缺陷 是 子 程序 的 设计 。 
模拟 要 求 子 程序 能 够 从 以 前 停止 的 位 置 重 新 开始 运行 。 具 有 这 种 控制 结构 的 子 程序 都 被 称 为 协 
同 程序 ， 因 为 在 它们 的 调用 程序 与 被 调用 子 程序 之 间 存 在 一 种 彼此 平等 的 关系 ， 而 不 是 通常 在 
命令 式 语 言 中 所 有 的 硬性 层次 关系 。 

为 了 在 SIMULA 67 中 提供 对 协同 程序 的 支持 ， 人 们 开发 了 类 (class) 结构 。 这 是 一 项 十 分 
重要 的 发 展 ， 因 为 我 们 的 数据 抽象 概念 就 是 由 此 开始 的 。 类 的 基本 概念 是 将 数据 结构 以 及 操纵 这 
种 数据 结构 的 程序 包装 在 一 起 。 此 外 ， 类 的 定义 只 是 一 个 用 于 数据 结构 的 模板 ， 它 与 类 的 实例 是 
不 同 的 ， 因 此 程序 能 够 产生 并 且 使 用 某 一 个 类 中 任意 数目 的 实例 。 类 的 实例 能 够 包括 局 部 数据 。 
类 的 实例 也 能 够 包括 实例 产生 时 执行 的 代码 ， 这 些 代码 可 以 将 一 些 类 实例 的 数据 结构 初始 化 。 

对 于 类 以 及 类 实例 的 比较 完整 的 讨论 ， 将 在 第 11 章 中 给 出 。 有 趣 的 是 直到 1972 年 ， 当 Hoare 
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(1972) 认识 到 这 种 数据 抽象 与 类 的 关联 时 ， 才 将 数据 抽象 的 重要 概念 发 展 和 归结 到 类 的 结构 之 中 。 
2.11 正 交 性 语言 的 设计 : ALGOL 68 


ALGOL 68 是 语言 设计 中 几 种 新 思想 的 起 源 ， 其 中 的 一 些 后 来 被 其 他 语言 采纳 ， 这 就 是 在 
这 本 书 中 包括 ALGOL 68 的 原因 ， 尽 管 它 从 来 没有 在 欧洲 或 美国 得 到 广泛 地 应 用 。 


2.11.1 设计 过 程 


当 ALGOL 语 言 的 修改 报告 于 1962 年 发 表 时 ，ALGOL 语 言 系列 的 开发 工作 并 没有 结束 ， 又 
过 了 6 年 之 后 ，ALGOL 语 言 的 下 一 个 设计 版 本 被 发 表 。 最 后 产生 的 语言 ALGOL 68 (van 
Wijngaarden et al., 1969) 与 先前 的 ALGOL 语言 有 着 显著 不 同 ，。 

ALGOL 68 最 具 意义 的 革新 是 它 的 主要 设计 准则 之 一 : EZE, 回顾 我 们 在 第 1 章 中 关于 语 
言 正 交 性 的 讨论 。 正 交 性 的 运用 导致 了 ALGOL 68 语 言 的 一 些 新 颖 特性 ， 我 们 将 在 下 面 的 小 节 
中 描述 其 中 的 一 个 特性 。 


2.11.2 语言 概述 


ALGOL 68 中 正 交 性 的 一 个 重要 成 果 是 它 所 包含 的 用 户 定义 的 数据 类 型 。 早 期 的 语言 ， 如 
Fortran， 只 包含 了 少量 的 基本 数据 结构 ， 而 PL/I 语 言 包括 了 大 量 的 数据 结构 ， 这 使 得 学 习 与 实 
现 这 种 语言 极为 困难 ， 并 且 它 显然 不 能 提供 一 种 适用 于 所 有 应 用 问题 的 数据 结构 ， 

ALGOL 68 中 数据 结构 的 设计 方式 是 ， 在 语言 中 只 提供 少量 的 基本 类 型 和 基本 结构 ， 而 个 
许 用 户 将 这 些 基 本 类 型 与 基本 结构 相 结合 来 产生 大 量 的 不 同 结构 。 这 种 在 语言 中 提供 用 户 定义 
数据 类 型 的 方法 ， 在 相当 大 的 程度 上 几乎 被 所 有 自 此 以 后 所 设计 的 主要 命令 式 语言 所 继承 。 用 
户 定 义 的 数据 类 型 很 有 价值 ， 它们 可 以 让 用 户 设 计 非 常 接近 某 些 特定 问题 的 合适 的 数据 抽象 。 
关于 数据 类 型 的 全 面 讨论 将 放 在 第 6 章 中 。 

妃 一 个 在 数据 结构 领域 里 的 第 一 是 ALGOL 68 首次 引入 了 动态 数组 ， 我 们 在 第 5 章 称 这 种 动 
态 数 组 为 隐 式 堆 动态 。 动 态 数组 是 指 该 数组 的 声明 不 规定 其 下 标 范 围 的 限制 。 对 一 个 动态 数组 
赋值 才 导 致 为 该 数组 分 配 所 需要 的 存储 空间 。 在 ALGOL 68 中 ， 动 态 数组 称 为 flex 数组 。 


2.11.3 评估 


ALGOL 68 包 括 了 在 此 之 前 从 未 被 程序 设计 语言 使 用 过 的 大 量 特性 ， 它 对 于 正 交 性 的 运用 
宣 无 疑问 是 革命 性 的 ， 尽 管 某 些 人 可 能 认为 过 分 了 。 

然而 ALGOL 68 重 复 了 ALGOL 60 的 一 个 错误 ， 这 也 是 这 种 语言 仅 获得 有 限 接受 的 一 个 重要 
因素 。 这 就 是 ， 用 来 描述 这 种 语言 的 是 一 种 优雅 与 简洁 但 却 鲜 为 人 知 的 元 语言 。 在 人 们 能 够 阅 
ities ALGOL 68 的 文件 (van Wijngaarden et al., 1969) 之 前 ， 必须 学 习 这 种 被 称 为 van 
WUngaarden 文 法 的 新 的 元 语言 。 更 为 粳 糕 的 是 ，ALGOL 68 的 设计 人 员 还 生 造 了 一 系列 的 术语 
用 来 解释 它 的 文法 和 语言 。 例 如 ， 将 “关键 字 ”(keyword) 称 为 “指示 符 ” (indicant), ， 将 “ 子 
字符 串 提 取 ” (substring extraction) 称 为 “修剪 ”(trimming)， 将 过 程 执行 的 处 理 ”(process 
of procedure execution) 称 为 “ 非 过 程 化 强制 ”(coercion of deproceduring), ， 而 这 种 强制 还 可 以 
是 “柔和 的 ”(meek)、“ 固 定 的 ”(firm) 或 者 别 的 什么 。 

人 们 会 很 自然 地 将 ALGOL 68 的 设计 与 PL/I 的 设计 进行 对 比 。ALGOL 68 靠 运用 正 交 性 原理 
取得 了 可 写 性 : 只 用 极 少 量 的 基本 概念 加 上 无 限制 地 使 用 几 种 结合 机 制 。 而 PL/I PUARE 
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固定 的 结构 来 达到 可 写 性 。ALGOL 68 延 续 了 ALGOL 60 语 言 优雅 的 简单 性 ， 而 PL/I 语言 仅仅 靠 
将 几 种 语言 的 特性 简单 地 堆积 在 一 起 来 达到 它 的 目标 。 当 然 我 们 也 必须 记 住 ，PL/ 的 目的 是 要 
为 广泛 类 型 的 应 用 问题 提供 一 种 统一 工具 ， 与 此 正好 相反 ，ALGOL 68 所 针对 的 只 是 一 种 类 型 
的 问题 : 科学 应 用 。 

PL/I 歼 得 了 远 远 高 于 ALGOL 68 的 接纳 程度 ， 其 中 很 大 一 部 分 的 原因 归结 于 IBM 公 司 的 促进 
工作 ， 以 及 人 们 对 于 ALGOL 68 语 言 在 理解 与 实现 上 所 存在 的 问题 。 这 两 种 语言 的 实现 都 是 一 
个 困难 问题 ,但 PL/I 获 得 了 IBM 公 司 的 资源 来 建造 它 的 编译 器 ， 而 ALGOL 68 则 没有 得 到 这 样 的 
赞助 者 。 


2.12 早期 ALGOL 系 列 语言 的 后 代 产 品 


所 有 他 令 式 语 言 ， 包 括 如 C++ 和 Java 之 类 的 命令 式 /面向 对 象 语言 ， 它 们 的 一 些 设计 成 果 都 
应 该 归功 于 ALGOL 60 以 及 /或 者 ALGOL 68 语 言 。 本 节 将 讨论 这 些 语言 早期 的 一 些 后 代 语言 。 


2.12.1 为 简单 性 而 设计 的 语言 :Pascal 


2.12.1.1 历史 背景 

Niklaus Wirth (Wirth 发 音 为 “Virt”) 是 国际 信息 处 理 联合 会 (International Federation of 
Information Processing, IFIP) 2.1 工 作 组 的 一 个 成 员 。 这 个 工作 组 成 立 于 20 世 纪 60 年 代 的 中 期 ， 
其 目的 是 为 了 继续 ALGOL 语言 的 开发 。Wirth 与 C.A.R. Hoare 于 1965 年 8 月 为 继续 这 方面 工作 ， 
加 工作 组 提交 了 略 显 保 守 的 、 意 欲 增 加 和 修改 ALGOL 60 的 提案 (Wirth 和 Hoare，1966)。 然 而 
工作 组 内 的 多 数 成 员 因 为 这 种 改进 在 ALGOL 60 原 有 的 基础 上 进步 太 小 而 否决 了 这 个 提案 。 代 
之 以 开发 了 一 个 更 为 复杂 的 语言 版 本 提案 ， 并 最 后 演变 成 了 ALGOL 68。Wirth 连 同 其 他 几 个 工 
作 组 的 成 员 ， 基 于 ALGOL 68 语 言 的 本 身 ， 以 及 用 来 描述 ALGOL 68 的 元 语言 的 复杂 性 ， 认 为 不 
应 该 公布 关于 ALGOL 68 的 报告 。 他 们 的 这 种 立场 后 来 被 证 明 不 无 道理 ， 因 为 计算 机 界 的 确 发 
现 ，ALGOL 68 语 言 的 文件 以 及 语言 的 本 身 正 接受 考验 。 

Wirth 和 Hoare 的 ALGOL 60 的 修订 版 本 被 命名 为 ALGOL-W。ALGOL-W 后 来 在 斯 坦 福 大 学 被 实 
现 ， 并 主要 被 用 来 作为 一 种 教学 工具 ， 而 且 它 只 是 用 于 很 少 的 几 所 大 学 里 。ALGOL-W 语言 的 主要 
页 献 是 参数 的 按 值 -结果 传递 方法 ， 以 及 多 样 选 择 的 case 语 句 。 按 值 -结果 传递 方法 是 ALGOL 60 中 
按 名 传递 方法 的 一 种 替代 方法 。 这 两 种 方法 都 将 在 第 9 章 里 讨论 。case 语 句 则 将 在 第 8 章 里 讨论 。 

Wirth 的 下 一 个 主要 设计 工作 再 一 次 地 基于 ALGOL 60 语 言 。 这 一 次 是 他 最 成 功 的 工作 : 
Pascal 语 言 。 “早期 发 表 的 Pascal 语 言 的 定义 公布 于 1971 年 (Wirth，1971) 。 这 个 版 本 在 实现 的 
过 程 中 被 稍 作 修 改 ， 并 由 Wirth 进 行 了 描述 (Wirth，1973) 。 一 些 常常 被 归于 Pascal 语言 的 特性 
事实 上 来 自 于 更 早期 的 语言 。 例 如 ， 用 户 定义 的 数据 类 型 是 在 ALGOL 68 中 被 引入 的 ，case 
语句 来 日 于 ALGOL-W， 而 Pascal 中 的 记录 数据 类 型 与 COBOL 和 PL/I 语言 中 的 类 似 。 

2.12.1.2 评估 

Pascal 语言 的 最 大 影响 是 在 程序 设计 的 教学 方面 。 在 1970 年 ， 大 多 数 的 计算 机 、 工 程 以 及 
科学 学 科 的 学 生 使 用 Fortran 语 言 作 为 程序 设计 的 入 门 ， 尽 管 当时 也 有 些 大 学 使 用 PL/I、 基 于 
PL/I 的 其 他 语言 ， 以 及 ALGOL-W。 到 20 世 纪 70 年 代 的 中 期 ，Pascal 已 经 成 为 教学 用 途中 最 为 
广泛 应 用 的 语言 。 这 种 结果 也 许 不 能 预测 ， 但 却 十 分 自然 ， 因 为 Pascal 实际 上 是 专门 为 程序 设 


© “Pascal 语言 是 随 名 字 Blaise Pascal 而 命名 的 。 Blaise Pascal 是 法 国 17 世 纪 的 一 位 哲学 家 和 数学 家 ， 他 曾经 在 1642 
年 发 明了 第 一 台 机 械 加 法 机 器 ， 还 有 其 他 的 一 些 发 明 。 
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计 的 教学 而 设计 的 。 直 到 20 世 纪 90 年 代 的 未 期 ， Pascal 才 不 再 是 大 专 院 校 中 最 普遍 使 用 的 程序 
设计 教学 语言 。 

因为 Pascal 语 言 被 设计 为 一 种 教学 使 用 语言 ， 所 以 缺乏 多 种 类 型 的 应 用 所 必须 的 许多 基本 特 
性 。 其 中 最 具 说 服 力 的 一 个 例子 便 是 ， 不 色 g 够 使 用 Pascal 来 编写 一 个 将 可 变 长 度数 组 作为 参数 
的 子 程序 。 另 一 个 例子 是 ，Pascal 缺乏 分 别 编译 的 能 力 。 这 些 特性 的 缺乏 ， 自 然 导 致 了 许多 非 
标准 的 方言 的 产生 ， 如 Turbo Pascal, 

Pascal 在 程序 设计 的 教学 以 及 其 他 应 用 中 得 到 广泛 使 用 的 主要 原因 ， 是 这 种 语言 所 具有 的 简 
单 性 Se Me 合 。 尽 管 在 Pascal 语言 中 也 存在 着 一 些 不 安全 的 因素 ， 但 它 仍然 是 
一 种 相对 安全 的 语言 ， 尤 其 是 与 Fortran 及 C 语言 相 比 。 到 了 20 世 纪 90 年 代 中 期 ， 无 论 是 在 工业 
界 或 者 大 专 院 校 ， pascal 的 应 用 都 碱 少 了 ， 这 主要 是 因为 Modula-2、Ada 和 C++ 语言 的 崛起 ， 它 
们 都 包含 有 Pascal 不 具备 的 特性 。 

下 面 是 Pascal 程 序 的 一 个 例子 : 


{Pascal Example Program 
Input: An integer, listlen, where listlen is less than 
100, followed by listlen-integer values 
Output: The number of input values that are greater than 
the average of all input values } 
program pasex (input, output); 
type intlisttype = array [1..99] of integer; 
var 
intlist : intlisttype; 
listlen, counter, sum, average, result : integer; 
begin 
result := 0; 
sum := 0; 
readin (listlen); 
if ((listlen > 0) and (listlen < 100)) then 
begin 
{ Read input into an array and compute the sum } 
for counter := 1 to listlen do 
begin 
readin (intlist[counter]); 
sum := sum + intlist[counter] 
end; 
{ Compute the average } 
average := sum / listlen; 
{ Count the number of input values that are > average } 
for counter := 1 to listlen do 
if (intlist[counter] > average) then 
result := result + 1; 
{ Print the result } 
writeln ('The number of values > average is:', 


result) 
end { of the then clause of if (( listlen > 0... } 
else 
writeln (‘Error—input list length is not legal') 
enc. 


2.12.2 可 移植 的 系统 语言 : C 


与 Pascal 语 言 类 似 ，C 也 几乎 没有 创新 的 语言 特性 ， Pigs 它 的 广泛 应 用 延续 了 一 个 相当 长 
的 时 期 。 尽 管 C 原 来 是 专门 为 系统 程序 设计 而 设计 的 语言 ， 但 它 十 分 适合 于 广阔 范围 内 的 各 种 
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应 用 。 

2.12.2.1 历史 背景 

的 前 非 语 言 包 括 CPL、BCPL、B 和 ALGOL 68。CPL 是 于 20 世 纪 60 年 代 初 期 由 剑桥 大 学 
开发 的 。BCPL 则 是 于 1967 年 由 Martin Richards 开 发 出 来 的 一 种 简单 系统 程序 设计 语言 
(Richards，1969 ) 。 

20 世 纪 60 年 代 末 期 , 由 Ken Thompson 在 贝尔 实验 室 首 次 进行 了 C 在 UNIX 操 作 系统 上 的 工作 。 
C 的 第 一 个 版 本 是 用 汇编 语言 写成 。 而 在 UNIX 系 统 上 实现 的 第 一 种 高 级 语言 是 B 语 言 ， 它 是 一 
种 基于 BCPL 的 语言 。B 语 言 于 1970 年 由 Thompson 设 计 并 实现 。 

BCPL 与 B 都 不 是 一 种 类 型 化 的 语言 ， 这 在 高 级 语言 中 是 一 个 异类 ， 虽 然 这 两 种 语言 的 层次 
都 要 比 Java 这 类 语言 要 低 很 多 。 无 类 型 语言 意味 着 其 中 所 有 的 数据 都 被 认为 是 机 器 字 ， 这 种 情 
形 尽管 极为 简单 ， 却 导致 了 许多 复杂 性 与 安全 性 问题 。 例 如 ， 如 何在 表达 式 中 说 明 是 浮 点 数 而 
不 是 整数 的 算术 运算 问题 。 在 BCPL 的 一 种 实现 中 ， 是 在 进行 浮 点 数 运算 的 操作 数 前 面 放 置 一 个 
句号 ， 所 有 前 面 没 有 句号 的 操作 数 都 被 认为 是 整数 。 这 种 表达 形式 的 另 一 种 替代 形式 是 必须 为 
浮 点 数 操作 使 用 不 同 的 符号 。 

这 种 问题 连同 其 他 的 一 些 问 题 一 起 导致 了 一 种 基于 B 语 言 的 新 类 型 化 语言 的 发 展 。 这 就 是 
最 初 被 称 为 NB 语言 然后 被 命名 为 C 的 语言 。 这 种 语言 是 于 1972 年 由 Dennis Ritchie 在 贝尔 实验 室 
里 设计 并 实现 的 (Kernighan and Ritchie，1978) 。C 受 到 了 ALGOL 68 的 影响 ， 有 些 是 经 由 
BCPL 而 受 有 影响， 而 另 一 些 则 是 直接 来 自 于 ALGOL 68 的 影响 。 这 些 影响 通过 它 的 for 语 句 、 它 
的 switch 语 句 、 它 的 赋值 操作 符 以 及 指针 处 理 而 可 见 一 斑 。 

在 最 初 的 十 多 年 中 ， 有 关 C 语 言 的 唯一 “标准 ”是 Kernighan 和 Ritchie 所 编写 的 书 
(Kernighan and Ritchie, 1978), © C 在 这 一 段 时 期 经 历 了 缓慢 的 演变 ， 不 同 的 实现 人 员 给 C 语言 
增加 了 不 同 的 特性 。1989 年 ， 美 国 国家 标准 协会 (ANSI) 产生 了 C 的 正式 描述 版 本 (ANSI, 
1989) ， 其 中 包括 了 已 经 由 实现 人 员 结合 进来 的 许多 语言 特性 。 这 个 标准 版 本 于 1999 年 再 次 被 更 
新 (ISO，1999)。 这 个 新 版 本 包含 语言 的 一 个 重大 改变 。C 的 1989 年 版 本 在 很 长 的 时 期 内 都 被 
称 为 ANSIC， 我 们 现在 应 该 称 它 为 C89， 而 将 C 的 1999 年 版 本 称 为 C99。 

2.12.2.2 评估 

C 上 共有 足够 的 控制 语句 以 及 数据 结构 化 的 设施 ， 这 允许 它 能 够 被 用 于 各 种 应 用 领域 。C 也 具 
有 丰富 的 操作 符 ， 这 给 语言 提供 了 极 高 的 表达 性 。 

人 们 对 于 C 语 言 既 喜爱 又 不 喜爱 的 一 个 最 重要 的 原因 ， 是 它 缺 乏 完 整 的 类 型 检测 。 例 如 在 
C99 以 前 的 版 本 中 ， 函 数 参数 可 以 不 经 过 类 型 检测 。 喜 爱 C 语 言 的 人 珍视 它 的 灵活 性 ， 而 不 喜爱 
C 的 人 则 感觉 它 太 不 安全 。C 语 言 受 欢迎 的 程度 在 20 世 纪 80 年 代 急剧 增加 ， 其 中 的 一 个 主要 原因 
是 ，C 语 言 的 编译 器 是 使 用 广泛 的 UNIX 操 作 系 统 的 一 部 分 。 这 种 编译 器 幅 入 UNIX 系 统 ， 为 不 
同类 型 计算 机 的 程序 人 员 提 供 了 基本 免费 和 性 能 优异 的 编译 器 。 

下 面 是 C 程 序 的 一 个 例子 : 


/* C Example Program 

Input: An integer, listlen, where listlen is less than 
100, followed by listlen-integer values 

Output: The number of input values that are greater than 
the average of all input values */ 


日 ”这 种 语言 常常 也 被 称 为 “K &RC”。 
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void main (){ 
int intlist[98], listlen, counter, sum, average, result; 
sum = 0; 
result = 0; 
scanf("td", &listlen); 
if ((listlen > 0) && (listlen < 100)) { 
/* Read input into an array and compute the sum */ 
for (counter = 0; counter < listlen; counter++) { 
scanf("%d", &intlist[counter]); 
sum += intlist[counter]; 


} 


/* Compute the average */ 
average = sum / listlen; 
/* Count the input values that are > average */ 
for (counter = 0; counter < listlen; counter++) 
if (intlist[counter] > average) result++; 
/* Print result */ 
printf("Number of values > average is:%d\n", result); 


} 
else 
printf("Error—input list length is not legal\n"); 


} 
2.12.3 一 种 (或 多 或 少 ) 相关 的 语言 ， Per 


我 们 在 本 市 简略 地 讨论 Perl 语 言 的 起 源 与 特征 。 就 理想 情况 而 言 ，Perl 语 言 肯 定 不 完全 适合 
于 这 一 廊 一 一 它 与 ALGOL 语 言 的 联系 仅仅 是 通过 C， 而 且 即 使 是 通过 C 语 言 ， 也 仅仅 是 在 语法 以 
及 基本 控制 语句 方面 。 然 而，Perl 语 言 也 不 适合 于 这 一 章 中 的 任何 其 他 小 节 ， 尽 管 它 的 重要 性 
还 不 足以 让 它 单独 占用 一 个 小 节 ,， 但 它 是 不 应 该 被 忽略 的 。 

2.12.3.1 历史 背景 

脚本 语言 在 过 去 的 25 年 间 发 展 了 起 来 。 早 期 的 脚本 语言 被 用 来 在 一 个 执行 文件 中 放置 一 列 
饼 称 为 脚本 (script) 的 指令 。 第 一 种 脚本 语言 命名 为 sh (意义 为 shell) ， 开 始 于 一 小 组 指令 ， 这 
些 指令 被 翻译 为 对 系统 中 功能 性 子 程序 的 调用 ， 这 些 功能 包括 文件 的 管理 以 及 简单 文件 的 筛选 。 
在 这 一 组 指令 的 基础 之 上 又 增加 了 变量 、 控 制 流 语句 、 函 数 以 及 其 他 的 各 种 功能 ， 结 果 是 形成 
了 一 套 完 整 的 程序 设计 语言 。 这 类 语言 中 功能 最 强大 并 且 最 著名 的 是 ksh 语 言 (Bolsky and 
Korn, 1995) ， 它 由 David Korn 在 贝尔 实验 室 开 发 产生 。 

为 一 种 脚本 语言 是 awk 语 言 ， 它 由 Al Aho, Brian Kernighan) K Peter Wienberger 在 风 尔 实验 
室 开 发 完成 Aho et al., 1988) 。awk 语 言 在 开始 时 是 一 种 报告 生成 语言 ， 后 来 成 为 了 一 种 更 为 通 
用 的 语言 。tc1 语 言 是 一 种 可 扩展 的 脚本 语言 ， 由 John Ousterhout 在 加 利 福 尼 亚 大 学 伯克利 分 校 
开发 (Ousterhout，1994)。tcl 语 言 现在 已 经 与 一 种 提供 建造 GUI 方 法 的 tk 语言 相 结合 。 

由 Larry Wall 所 开发 的 Perl 语 言 (Wall et al., 2000), 其 最 初 形 式 是 sh 语言 和 awk 语言 的 结 
合 。Perl 语 言 自 创 始 以 来 有 了 极为 重大 的 发 展 ， 现 在 已 经 成 为 一 种 有 强大 功能 但 还 有 些许 原始 
的 程序 设计 语言 。 尽 管 人 们 仍然 通常 称 Perl 语 言 为 脚本 语言 ， 但 它 实 际 上 更 类 似 于 一 种 典型 的 
命令 式 语 言 ， 因 为 在 这 种 语言 被 执行 之 前 ， 它 经 常 被 编译 成 为 一 种 中 间 语 言 的 形式 。 此 外 ， 这 
种 语言 有 着 所 有 可 能 的 各 种 结构 ， 这 使 得 它 能 够 被 应 用 于 广泛 多 样 的 计算 问题 。 

2.12.3.2 语言 的 特征 性 质 

Perl 语 言 具有 许多 有 趣 的 特性 ， 我 们 仅 在 本 章 中 提出 并 在 本 书 的 剩余 章节 里 讨论 其 中 少数 
几 个 特性 。 
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Perl 中 的 变量 是 被 静态 类 型 化 ， 并 且 被 隐 式 地 声明 。 它 的 变量 具有 三 个 不 同 的 命名 空间 ， 
分 别 由 变量 名 中 的 第 一 个 字符 来 标记 。 所 有 的 数量 变量 名 始 于 “$” 符 号 ， 所 有 的 数组 名 始 于 
@ 符号 ， 以 及 所 有 的 散 列 名 (下面 将 简要 介绍 散 列 ) 始 于 百 分 号 “%”。 这 种 规定 使 得 Perl 程 
序 中 的 变量 名 比 在 其 他 程序 设计 语言 中 的 变量 名 可 读 性 更 好 。 

Perl 语 言 还 包括 了 大 量 的 隐 性 变量 。 一 些 隐 性 变量 被 用 来 存 蓄 Perl 中 的 参数 ， 例 如 ， 特 殊 形 
式 的 换行 字母 或 者 用 在 实现 中 的 字母 。 隐 性 变量 通常 被 用 作 内 建 函 数 中 的 默认 参数 ， 以 及 其 些 
操作 符 中 的 默认 操作 数 。 这 些 隐 性 变量 都 具有 不 同 (尽管 是 有 点 神秘 ) 的 名 字 ， 形 如 “$1” 和 
“8@_“。 隐 和 性 变量 的 名 字 也 类 似 于 用 户 定义 的 变量 名 ， 同 样 使 用 三 个 名 字 空 间 ， 所 以 “$1!1” 是 一 
个 标量 。 

Perl 数 组 的 两 种 特征 使 得 它们 不 同 于 一 般 命 令 式 语言 中 的 数组 。 首 先 ， 它 们 具有 动态 长 度 ， 
这 意味 着 它们 在 执行 期 间 可 以 根据 需要 伸 长 或 缩短 。 第 二 ， 数 组 可 以 是 稀疏 的 ， 这 意味 着 数组 
的 元 素 之 间 可 以 存在 空隙 。 这 些 空隙 在 储存 空间 以 及 在 用 于 数组 的 循环 语句 中 都 并 不 占有 位 置 ， 
foreach 循 环 将 越过 空缺 的 元 素 进行 。 

Perl 语 言 包 括 了 关联 数组 ， 这 种 关联 数组 被 称 为 散 列 。 散 列 数据 结构 是 通过 字符 串 进行 素 
引 ， 古 一 些 隐 性 控制 的 散 列 表 。Per 系 统 提供 散 列 函数 ， 并 在 需要 时 增加 散 列 结构 的 大 小 ， 

2.12.3.3 评估 

Perl 征 一 种 功能 强大 但 又 有 某 种 程度 的 危险 性 的 语言 。 它 的 标量 类 型 既 可 储存 字符 串 又 可 
储存 数值 两 种 类 型 ， 而 通常 ， 数 值 是 以 双 精 度 浮 点 数 的 形式 来 储存 的 。 取决 于 数值 所 在 的 环境 ， 
有 时 候 数 值 可 能 会 被 强制 转换 成 为 字符 串 ， 或 者 是 反 过 来 ， 即 字符 串 会 被 强制 转换 为 数值 。 如 
洒 一 个 字符 串 被 用 于 数值 环境 中 ， 并 且 这 个 字符 串 不 能 够 被 转换 成 数值 ， 则 会 赋予 0 值 ， 而 且 不 
会 给 用 户 送 出 任何 警告 或 出 错 信息 ， 这 将 寻 致 编译 器 或 运行 时 系统 都 不 能 发 现 的 错误 。 数 组 索 
5| 不 能 够 被 检测 ， 因 为 没有 数组 下 标的 范围 。 对 于 空缺 元 素 的 引用 将 返回 undef， 这 在 数值 环 
境 里 被 翻译 为 0 值 ， 因 而 在 数组 元 素 的 访问 中 也 不 会 发 现 错误 ， 

Perl 语 言 的 最 初 使 用 是 作为 UNIX 系 统 中 用 于 文字 文件 处 理工 具 的 功能 语言 。 无 论 是 在 当时 
还 是 现在 ， 它 一 直 都 被 用 作 UNIX 系 统 的 管理 工具 。 万 维 网 出 现 以 后 ， Perl 作 为 用 于 万 维 网 的 通 
关 接 口语 言 得 到 了 广泛 的 应 用 ， 尽 管 Perl 的 使 用 正在 减少 。 现在 Perl 更 是 用 于 各 种 应 用 的 一 种 通 
用 语言 ， 它 的 应 用 包括 了 计算 生物 学 和 人 工 智能 。 

下 面 是 Perl 程 序 的 一 个 例子 ; 


# Perl Example Program 

# Input: An integer, $listlen, where $listlen is less 

# than 100, followed by $listlen-integer values. 

# Output: The number of input values that are greater than 

# the average of all input values. 

($sum, $result) = (0, 0); 

$listlen = <STDIN>; 

if (($listlen > 0) && ($listlen < 100)) { 

# Read input into an array and compute the sum 

for (Scounter = 0; $counter < $listlen; Scounter++) { 
Sintlist[$counter] = <STDIN>; 

} #- end of for (counter ... 

Compute the average 

Saverage = $sum / $listlen; 

Count the input values that are > average 

foreach $num (@intlist) { 
if ($num > $average) { $result++; } 

} #- end of foreach $num ... 


+ 


+ 
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# Print result 
print "Number of vlues > average is: $result \n"; 
} #- end of if (($listlen ... 


else { 
print "Error--input list length is not legal \n"; 


$ 


2.13 基于 逻辑 的 程序 设计 : Prolog 

简 言 之 ， 逻 辑 程序 设计 就 是 运用 形式 逻辑 标记 ， 就 计算 过 程 与 计算 机 进行 通讯 。 谓 词 演算 
是 目前 逻辑 程序 设计 语言 中 所 使 用 的 标记 方法 。 

逻辑 程序 设计 语言 中 的 程序 设计 是 非 过 程 的 。 这 类 语言 的 程序 并 不 严格 说 明 怎 样 计算 以 求 
得 结果 ; 相反 ， 它 只 是 描述 这 种 必要 的 形式 和 (或 ) 结果 的 特征 。 为 了 让 程序 设计 语言 具有 这 
样 一 种 功能 ， 需 要 有 精确 的 方式 给 计算 机 提供 相关 的 信息 以 及 求 取 所 需 结果 的 推理 方式 。 谓 词 
演算 提供 了 人 机 通讯 的 基本 逻辑 形式 ， 以 及 命名 为 归结 (resolution) 的 证 明 方 法 ， 这 种 由 
Robinson (Robinson, 1965) 首先 开发 的 证 明 方法 提供 了 这 种 推理 技术 。. 


2.13.1 设计 过 程 


在 20 世 纪 70 年 代 的 初期 ，Aix-Marseille 大 学 人 工 智能 小 组 的 Alain Colmerauer 和 Phillippe 
Roussel, 与 爱丁堡 大 学 人 工 智能 系 的 Robert Kowalski 一 起 ， 进 行 了 关于 Prolog 语言 的 基本 设计 。 
Prolog 的 主要 组 成 部 分 是 一 种 说 明 谓 词 演 算命 题 的 方法 ， 以 及 一 种 归结 受 限 形式 的 实现 。 谓 词 
演算 与 归结 都 将 在 第 16 章 里 描述 。 第 一 个 Prolog 语 言 解释 器 于 1972 年 在 Marseille 开发 完成 。 这 
个 实现 了 的 Prolog 版 本 由 Roussel 给 予 描述 (Roussel，1975)。Prolog 的 名 称 来 自 “逻辑 程序 设计 ” 
(programming logic) 中 两 个 英文 单词 的 各 自前 三 个 字母 。 


2.13.2 语言 概述 


Prolog 程 序 由 一 系列 语句 组 成 。Prolog 语 言 只 具有 很 少 的 语句 类 型 ， 但 这 些 语句 是 复杂 的 。 

Prolog 语 言 最 通常 的 用 法 是 作为 一 种 智能 数据 库 ， 这 种 应 用 为 我 们 讨论 Prolog 语言 提供 了 
一 个 简单 的 框架 。 

一 个 Prolog 程 序数 据 库 包括 两 种 类 型 的 语句 : 事实 与 规则 。 事 实 语句 的 例子 有 


mother(joanne, jake). 
father(vern, joanne). 


这 里 说 明 的 是 ，joanne 是 jake 的 母亲 ，vern 是 joanne 的 父亲 。 

而 规则 语句 的 一 个 例子 是 

grandparent(X, Z) :- parent(X, Y), parent(Y, Z). 

这 里 说 明 的 是 ， 对 于 具有 特定 值 的 变量 x，Y 和 2 ， 如 果 这 些 条 件 为 真 ，X 是 Y 的 parent， 
并 且 Y 是 2 的 parent， 那 么 就 能 够 推断 出 : X 是 2 的 grandparent。 

我 们 能 够 使 用 目标 语句 与 Prolog 数 据 库 进 行 交互 式 查询 ， 这 样 的 一 个 例子 是 

father(bob, darcie). 

这 一 条 语句 意思 是 询问 : bob 是 不 是 darcie 的 父亲 。 当 传送 这 样 的 一 个 查询 或 者 目标 给 
Prolog 系 统 时 ， 这 个 系统 将 运用 归结 过 程 来 试图 确定 这 条 语句 的 真实 性 。 如 果 这 个 系统 能 够 得 
出 目标 为 真 的 结论 ， 将 会 显示 “true”， 否 则 ， 将 会 显示 “false”。 


2.13.3 评估 


在 20 世 纪 80 年 代 ， 只 有 少数 计算 机 科学 家 相信 : 逻辑 程序 设计 方法 提供 了 使 我 们 能 够 摆脱 
命令 式 语 言 复杂 性 的 最 大 希望 ， 也 是 最 有 和 希望 能 够 在 产生 所 需要 的 大 量 可 靠 软 件 中 避免 无 数 问 
题 。 然 而 到 目前 为 止 ， 有 两 个 主要 因素 阻碍 了 逻辑 程序 设计 方法 的 广泛 应 用 。 首 先 ， 也 像 其 他 
一 些 非 命令 式 方 法 一 样 ， 与 对 应 的 命令 式 程序 相 比 ， 用 逻辑 语言 编写 的 程序 被 证 明 是 极其 低 效 
的 。 其 次 ， 它 只 是 在 很 少 并 且 是 相对 小 的 应 用 领域 中 显示 出 是 一 种 有 效 方法 ， 这 些 领 域 为 某 种 
类 型 的 数据 库 管 理 系 统 ， 以 及 某 些 人 工 智能 领域 。 

Prolog 语 言 的 一 种 方言 Prolog++(Moss，1994) 支 持 面 向 对 象 的 程序 设计 。 关 于 逻辑 程序 设计 
和 Prolog 语 言 ， 将 在 第 16 章 中 给 予 详细 描述 。 


2.14 历史 上 规模 最 大 的 语言 设计 : Ada 


Ada 语 言 的 设计 是 有 史 以 来 涉及 范围 最 广 、 耗 资 最 大 的 工作 。 接 下 来 的 段落 简要 介绍 Ada 的 
发 展 过 程 。 


2.14.1 历史 背景 


Ada 是 为 美国 国防 部 (DoD) 开发 的 ， 所 以 在 决定 语言 的 形式 时 ， 其 计算 环境 状态 是 指令 
式 的 。 在 1974 年 以 前 ， 美 国 国防 部 内 超过 半数 的 计算 机 应 用 系统 是 戏 入 式 系统 。 艇 入 式 系统 是 
这 样 的 系统 : 在 这 种 系统 中 ， 计 算 机 的 硬件 被 嵌入 到 它 所 控制 或 者 服务 的 设备 之 中 。 当 时 软件 
费用 的 快速 增长 主要 源 于 系统 复杂 性 的 增加 。 美 国 国防 部 当时 使 用 着 450 种 以 上 不 同 种 类 的 程序 
设计 语言 用 于 它 的 各 种 项 目 ， 但 其 没有 对 其 中 任何 一 种 语言 实行 过 标准 化 。 每 一 个 国防 承包 商 
都 可 以 为 一 份 合同 定义 一 种 新 的 不 同 语言 。” 由 于 语言 的 大 量 繁殖 ， 应 用 软件 极 少 重复 使 用 。 
此 外 ， 设 有 产生 开发 软件 的 工具 (因为 它们 通常 是 附属 于 语言 的 )。 尽 管 使 用 着 大 量 语言 ， 但 没 
有 一 种 语言 适宜 于 典 入 式 系 统 的 应 用 。 由 于 这 些 原 因 ， 美 国 陆 、 海 、 空 三 军 于 1974 年 分 别 独立 
地 提出 了 开发 一 种 戏 入 式 系 统 高 级 语言 的 计划 。 


2.14.2 设计 过 程 


国防 研究 与 工程 部 主任 Malcolm Currie 注 意 到 了 这 种 广泛 要 求 ， 于 1975 年 1 月 成 立 了 高 级 语 
言 工作 组 (High-Order Language Working Group，HOLWG ) 。 这 个 工作 组 最 初 由 美国 空军 的 Lt. 
Col. William Whitaker 领 导 。HOLWG 中 有 来 自 所 有 军种 、 各 个 部 门 的 代表 ， 以 及 英国 、 法 国 和 
西 德 的 联络 官员 。 它 的 初始 章程 为 : 

。 确 认 新 的 美国 国防 部 高 级 语言 的 需求 。 

评估 现存 语言 以 决定 是 否 存在 一 种 可 行 的 候选 语言 。 

。 推荐 采用 或 者 实现 一 组 程序 设计 语言 的 最 小 集合 。 

1975 年 4 月 ， 高 级 语言 工作 组 产生 了 一 份 称 为 “ 草 人 ”(Strawman) 的 需求 文件 用 于 描述 新 
语言 (Department of Defense，1975a) 。 这 份 文件 被 分 发 到 各 个 军事 部 门 、 联 邦 政府 单位 、 有 选 
择 的 工业 及 大 专 院 校 代 表单 位 ， 以 及 对 此 感 兴趣 的 欧洲 团体 。 

在 “ 草 人 ”文件 之 后 ，1975 年 8 月 产生 了 “ 木 人 ”(Woodenman) 文件 (Department of 
Defense，1975b)， 于 1976 年 1 月 产生 了 “ 锡 人 ”(Tinman) 文件 (Department of Defense, 1976) 


O 这 种 结 采 主要 是 由 于 用 于 艇 入 式 系统 的 汇编 语言 的 广泛 流行 , 同时 缘 于 大 多 数 柳 入 式 系统 都 使 用 特殊 的 处 理 器 。 
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于 1977 年 1 月 产生 了 “铁人 ” (Ironman) 文件 (Department of Defense, 1977)， 最 终于 1978 年 6 月 
产生 了 “ 钢 人 ”(Steelman) 文件 (Department of Defense, 1978) 。 

在 乏味 的 过 程 之 后 ， 最 后 提交 的 语言 提案 缩小 到 四 家 ， 而 且 他 们 都 是 基于 Pascal 语 言 的 。 
1979 年 5 月 最 终 决 出 Cii Honeywell/Bull 的 语言 设计 为 优胜 者 。 有 趣 的 是 ， 最 后 优胜 者 是 参与 竞争 
的 四 个 商家 中 唯一 的 外 国 公司 。 这 家 法 国 的 Cii Honeywel Bull 设 计 组 由 Jean Ichbiah 领 导 。 

1979 年 春天 ， 海军 军需 司令 部 的 Jack Cooper 为 新 的 语言 推荐 了 “Ada” 名 字 ， 后 来 这 个 名 
字 被 采纳 。 值 得 纪念 的 是 ，Lovelace 伯爵 夫人 、 数 学 家 、 诗 人 拜 伦 的 女儿 Augusta Ada Byron 
(1815 一 1851 年 )， 她 被 普遍 认为 是 世界 上 的 第 一 位 程序 人 员 。 她 曾经 和 Charles Babbage 一 起 ， 
在 她 的 机 械 计 算 机 、 微 分 分 析 引 擎 上 工作 过 ， 为 许多 数值 处 理 编写 过 程序 。 

Ada 设 计 本 身 及 其 说 明 由 美国 计算 机 协会 (ACM) 发 表 于 SIGPLAN Notices (ACM，1979) 
之 上 ， 并 发 行 到 超过 一 万 的 读者 手中 。1979 年 10 月 ， 在 波士顿 举行 了 语言 的 公开 测试 与 评估 会 
议 。 与 会 代表 来 自 美国 和 欧洲 的 100 多 个 组 织 。 到 11 月 份 ， 已 经 收 到 了 来 自 15 个 不 同 国家 的 500 
多 份 关 于 语言 的 报告 。 其 中 大 部 分 报告 都 建议 进行 小 的 修改 ， 而 不 是 作 重 大 改动 ， 也 没有 对 于 
这 种 语言 的 绝对 否定 。 在 这 些 语言 报告 的 基础 上 ， 下 一 个 版 本 的 需求 说 明 “ 石 人 ” (Stoneman) 
文件 (Department of Defense, 1980a) 于 1980 年 2 月 发 表 。 

Ada 语 言 设计 的 校订 版 本 于 1980 年 7 月 完成 , 这 个 版 本 被 世人 接受 并 被 命名 为 MIL-STD 1815, 
也 即 标准 的 “Ada 语 言 参 考 手 册 ”(Ada Language Reference Manual)。 选 择 数字 “1815”， 是 因为 
它 是 Augusta Ada Byron 的 出 生 之 年 。“Ada 语 言 参考 手册 ”的 另 一 个 校订 版 本 公布 于 1982 年 7 月 。 
在 1983 年 ， 美 国 国 家 标准 协会 对 Ada 语言 实行 了 标准 化 。 这 个 “最 后 ”的 官方 版 本 由 Goos 和 
Hartmanis 描 述 (Goos and Hartmanis，1983)。 在 此 之 后 ，Ada 语 言 的 设计 至 少 被 冻结 了 5 年 。 


2.14.3 语言 概述 


本 市 我 们 简略 地 描述 Ada 语 言 的 四 个 主要 特性 。 

Ada 语 言 中 的 包 结 构 提 供 了 封装 数据 对 象 、 数 据 类 型 的 说 明 以 及 处 理 过 程 的 手段 。 如 我 们 
将 在 第 11 章 里 描述 的 ， 这 为 在 程序 设计 之 中 使 用 数据 抽象 提供 了 支持 。 

Ada 语 言 包 括 了 大 量 异常 处 理 的 机 制 ， 这 允许 程序 人 员 能 够 在 出 现任 何 一 种 异常 或 运行 时 
错误 时 取得 控制 。 关 于 异常 处 理 将 在 第 14 章 中 讨论 。 

Ada 中 的 程序 单元 可 以 是 通用 性 的 。 例 如 ， 可 以 用 Ada 语 言 来 编写 一 个 排序 过 程 ， 而 不 需要 
说 明 将 要 用 于 排序 的 数据 的 类 型 。 但 在 使 用 之 前 ， 必 须根 据 特定 的 排序 数据 将 通用 过 程 实例 化 。 
实例 化 可 由 一 条 语句 来 完成 ， 这 条 语句 指示 编译 器 按照 给 定 的 数据 类 型 产生 排序 过 程 的 一 个 版 
本 。 这 种 通用 程序 单元 增加 了 可 重复 使 用 程序 单元 的 范围 ， 而 不 是 由 程序 人 员 来 重新 产生 程序 。 
关于 通用 性 将 在 第 9 章 和 第 11 章 中 进行 讨论 。 

通过 使 用 会 合 (rendezvous) 机 制 ，Ada 语 言 还 提供 了 特殊 程序 单元 的 并 发 执行 ， 称 之 为 
任务 (task)。 会 合 是 任务 间 一 种 进行 通讯 和 同步 的 方法 的 名 称 。 关 于 并 发 将 在 第 13 章 中 讨论 。 
2.14.4 评估 

Ada 语 言 设 计 中 值得 讨论 的 最 重要 方面 也 许 是 下 面 几 项 ， 

“由 于 语言 的 设计 是 竞争 性 的 ， 因 而 对 参与 人 员 没 有 限制 。 


* Ada 语 言 包 含 了 20 世 纪 70 年 代 后 期 软件 工程 中 以 及 语言 设计 中 的 绝 大 部 分 概念 。 尽 管 人 们 
可 以 质疑 用 来 包括 这 些 语言 特性 的 实际 方法 以 及 在 一 种 语言 中 包括 如 此 众多 语言 特性 的 


可 取 性 ， 但 大 多 数 人 还 是 肯定 这 些 语言 特性 的 价值 。 

。Ada 语 言 编译 器 的 开发 是 一 项 困难 的 工作 ， 虽 然 许 多 人 最 初 没 有 意识 到 这 一 点 。 直 到 

1985 年 ，Ada 语 言 的 设计 工作 已 经 完成 约 4 年 之 后 ， 真 正 可 以 实际 使 用 的 Ada 编译 器 才 开 

始 出 现 。 

在 Ada 出 现 的 最 初 几 年 ， 对 它 最 严厉 的 批评 是 过 于 庞大 和 复杂 。 尤 其 是 Hoare 曾 经 声明 ， 
Ada 语 言 不 应 该 被 用 于 可 靠 性 至 为 关键 的 任何 应 用 上 (Hoare，1981) ， 但 不 幸 ，Ada 恰 恰 是 专门 
为 这 类 应 用 设计 的 。 另 一 部 分 人 则 与 此 相反 ， 称 赞 Ada 语 言 为 当时 语言 设计 的 典范 。 而 在 事实 
上 ， 束 连 Hoare 最 终 也 改变 了 对 Ada 语 言 的 严厉 观点 。 

下 面 是 Ada 程 序 的 一 个 例子 


-- Ada Example Program 
-- Input: An integer, List_Len, where List Len is less 
一 一 than 100, followed by List_Len-integer values 
-- Output: The number of input values that are greater 
一 一 than the average of all input values 
with Ada.Text_IO, Ada.Integer.Text_IO; 
use Ada.Text_I0, Ada.Integer.Text_I0; 
procedure Ada Ex is 
type Int_List_Type is array (1..99) of Integer; 
Int_List : Int List Type; 
List_Len, Sum, Average, Result : Integer; 
begin 
Result:= 0; 
Sum := 0; 
Get (List Len); 
if (List Len > 0) and (List Len < 100) then 
-- Read input data into an array and compute the sum 
for Counter := 1 .. List Len loop 
Get (Int _List(Counter) ); 
Sum := Sum + Int List(Counter) ; 
end loop; 
-- Compute the average 
Average := Sum / List Len; 
-- Count the number of values that are > average 
for Counter := 1 .. List Len loop 
if Int _List(Counter) > Average then 
Result:= Result+ 1; 
end if; 
end loop; 
-- Print result 
Put ("The number of values > average is:"); 
Put (Result); 
New Line; 
else 
Put_Line ("Error—input list length is not legal"); 
end if; 
end Ada _ Ex; 


2.14.5 Ada 95 


Ada 语 言 的 新 版 本 被 命名 为 Ada 95， 具 有 的 两 个 最 重要 的 新 语言 特性 将 在 下 面 的 段落 简略 
摘 述 。 在 本 书 的 剩余 部 分 ， 当 有 必要 区 分 新 老 两 个 版 本 时 ， 我 们 将 用 Ada 83 来 指 Ada 的 初始 版 
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本 ， 用 Ada 95 〈 它 的 真实 名 字 ) 来 指 后 来 的 新 版 本 。 在 讨论 这 两 种 版 本 所 共有 的 语言 特性 时 ， 
我 们 将 简单 地 采用 Ada 这 个 名 称 。Ada 95 的 标准 语言 被 定义 于 ARM 之 中 (ARM, 1995), 

Ada 83 的 类 型 派生 机 制 被 扩展 以 允许 从 父 类 型 派生 的 类 型 上 再 增加 新 的 成 分 。 这 就 提供 了 
继承 ， 继 承 征 面 问 对 象 程序 设计 语言 中 的 关键 成 分 。 子 程序 定义 与 子 程序 调用 之 间 的 动态 绑 定 
由 子 程序 的 发 送 来 完成 ， 这 种 发 送 基于 类 范围 的 类 型 中 派生 类 型 的 标志 值 。 这 种 特性 就 提供 了 
多 态 ， 多 态 是 面向 对 象 程序 设计 的 另 一 种 主要 特性 。Ada 95 的 这 些 特性 将 在 第 12 章 中 讨论 。 

Ada 83 语 言 中 的 会 合 机 制 仅 仅 提 供 了 并 发 进程 中 共享 数据 的 一 种 不 方便 和 低 效 率 的 手段 。 
当时 已 有 必要 引入 新 的 方法 来 控制 对 共享 数据 的 访问 。 对 此 ，Ada 95 中 的 被 保护 对 象 (protected 
object) 提供 了 一 种 很 有 吸引 力 的 替代 方法 。 在 这 种 方法 中 , 将 共享 数据 封装 于 一 种 语法 结构 中 ， 
由 这 种 结构 控制 所 有 对 数据 的 访问 ， 无 论 是 来 自 会 合 机 制 还 是 子 程序 调用 。 关 于 Ada 95 中 并 发 
和 共享 数据 的 新 特性 ， 将 在 第 13 章 中 讨论 。 

人 们 普 过 相信 : 因为 美国 国防 部 不 再 需要 在 军用 软件 系统 中 使 用 Ada 95， 所 以 Ada 95 应 用 
的 广泛 性 受到 了 影响 。 当 然 ， 其 他 一 些 因素 也 妨碍 了 这 种 语言 的 进一步 广泛 应 用 。 种 种 因素 之 
中 最 为 重要 的 ， 是 C++ 在 面向 对 象 程序 设计 领域 的 广泛 接受 。 事 实 上 ，C++ 语 言 在 Ada 95 被 公布 
以 前 就 已 经 很 受 欢 迎 了 。 


2.15 面 问 对 象 的 程序 设计 : Smalltalk 


Smalltalk 古 第 一 种 完全 支持 面向 对 象 程序 设计 的 程序 设计 语言 。 因 此 ， 对 这 种 程序 设计 语 
言 发 展 过 程 的 任何 讨论 都 是 重要 的 。 


2.15.1 设计 过 程 


促成 开发 Smalltalk 语 言 的 概念 始 于 20 世 纪 60 年 代 后 期 Alan Kay 在 犹他 大 学 的 博士 论文 工作 
(Kay，1969)。Kay 以 惊人 的 远见 预见 到 了 功能 强大 的 桌面 计算 机 在 未 来 的 广泛 使 用 。 请 记 住 ， 
第 一 台 微 型 计算 机 系统 直到 20 世 纪 70 年 代 中 期 才 被 推出 ， 况 且 它 们 与 Kay 想像 中 的 机 器 还 有 很 
大 的 距离 。Kay 所 预见 的 机 器 每 秒 执行 超过 一 百 万 条 指令 ， 并 具有 几 兆 字 节 的 内 存 。 以 工作 站 
为 形式 的 这 种 机 器 直到 20 世 纪 80 年 代 初期 才 广 泛 普及 。 

Kay 相 信条 面 计算 机 会 由 非 程 序 人 员 使 用 ， 因 而 需要 功能 很 强 的 人 机 接口 。20 世 纪 60 年 代 
后 期 的 计算 机 大 部 分 是 批 处 理 方式 的 (batch-oriented)， 为 专业 程序 员 和 科学 工作 者 大 量 使 用 。 
为 了 让 非 程序 人 员 使 用 ，Kay 预 测 计算 机 必须 具有 很 高 程度 的 交互 性 ， 并 且 使 用 复杂 的 图 形 用 
亡 界 面 。 一 些 关 于 图 形 的 概念 来 自 Seymour Papert 系 统 中 的 LOGO 图 形 经 验 ， 这 些 图 形 被 用 来 帮 
助 孩 子 们 使 用 计算 机 (Papert, 1980) 。 

Kay 节 初 想像 了 一 个 称 为 Dynabook 的 系统 ， 这 是 一 个 普通 的 信息 处 理 器 。 这 个 系统 部 分 地 
基于 他 曾经 帮助 设计 的 Flex 语 言 。Flex 主 要 建立 于 SIMULA 67 语 言 的 基础 之 上 。Dynabook 系 统 
基于 典型 的 桌面 图 形 ， 桌 面 上 有 许多 纸张 ， 一 些 纸张 被 部 分 压 盖 。 最 上 面 的 一 张 通常 是 注意 力 
焦 氮 之 所 在 ， 而 另外 的 一 些 纸张 则 暂时 处 于 注意 力 之 外 。 Dynabook 系 统 将 使 用 屏幕 视窗 的 画面 
来 模拟 这 种 桌面 场景 。 用 户 将 通过 使 用 键盘 或 者 他 或 她 的 手指 接触 屏幕 这 两 种 方法 与 系统 进行 
交互 。 在 Dynabook 系 统 的 初步 设计 为 Kay 赢 得 了 博士 学 位 之 后 ， 他 的 下 一 个 目标 便 是 要 亲眼 看 
见 这 种 系统 的 实现 。 

Kay 找 到 Xerox Palo Alto 研 究 中 心 (简称 Xerox PARC), H 了 关于 Dynabook 的 想法 。 结 果 
他 在 那里 被 雇用 , 并 接 下 来 组 织 诞生 了 “Xerox 学 习 研 究 小 组 ” (Learning Research Group at Xerox) , 
这 个 研究 小 组 接受 的 第 一 项 任务 是 设计 一 种 语言 来 支持 Kay 的 程序 设计 范 型 ， 并 将 这 种 语言 实现 


于 当时 最 好 的 个 人 计算 机 上 。 这 项 工作 产生 了 一 个 “过 渡 ” 的 Dynabook 系 统 ， 它 由 Xerox Alto 
的 硬件 以 及 被 称 为 Smalltalk-72 的 软件 组 成 ， 它 们 的 结合 形成 了 一 个 进一步 开发 研究 的 工具 。 许 
多 的 研究 项 目 都 曾经 在 这 个 系统 上 进行 ， 包 括 教 孩子 们 进行 程序 设计 的 一 些 实验 。 进 一 步 开 发 
实验 的 工作 同时 也 在 进行 ， 结 果 产 生 了 以 Smalltalk-80 为 最 终 版 本 的 Smalltalk 系 列 语言 。 
Smalltalk-80 正 是 本 书 将 要 讨论 的 一 种 版 本 。 随 着 这 种 语言 的 成 长 ， 运 行 这 种 语言 的 硬件 的 功能 
也 同时 在 增长 。 到 了 1980 年 ， 这 种 语言 以 及 Xerox 的 硬件 几乎 已 经 与 Alan Kay 最 初 的 设想 相 一 致 。 


2.15.2 语言 概述 


在 Smalltalk 语言 的 世界 里 ， 除 了 对 象 之 外 别 无 他 物 。 对 象 包括 了 从 简单 的 整数 常数 到 大 而 
复杂 的 软件 系统 。 在 Smalltalk 中 的 所 有 计算 都 由 相同 一 致 的 技术 来 完成 : 发 送 一 条 消息 给 一 个 
对 象 来 调用 它 的 一 个 方法 。 而 对 一 条 消息 的 回复 是 一 个 对 象 ， 这 个 对 象 返 回 所 要 求 的 信息 ， 或 
仅仅 通知 消息 的 发 送 者 ， 它 所 要 求 的 处 理 已 经 完成 。 消 息 与 子 程序 调用 之 间 的 根本 差别 在 于 : 
消 妃 被 发 送 到 一 个 数据 对 象 ， 特 别 是 为 该 对 象 定 义 的 方法 。 被 调用 方法 执行 ， 通 常 修改 消息 发 
送 到 的 对 象 的 数据 ， 一 次 子 程序 调用 是 一 条 发 送 给 子 程序 代码 的 消息 。 通 常 子 程 序 处 理 的 数据 
作为 一 个 参数 来 发 送 。” 

在 Smalltalk 中 ， 对 象 的 抽象 是 类 (class)。Smalltalk 中 的 类 非常 类 似 于 SIMULA 67 中 的 类 ， 
可 以 建立 类 的 实例 ， 并 且 实 例 在 被 创建 之 后 就 成 为 程序 中 的 对 象 。Smalltalk 语 法 不 像 任何 其 他 
程序 设计 语言 ， 主 要 是 因为 它 采 用 消息 机 制 ， 而 又 是 使 用 算术 和 逻辑 表达 式 或 者 传统 的 控制 语 
句 。 关 于 Smalltalk 控 制 结构 的 一 个 示例 将 在 下 一 个 小 节 中 给 


2.15.3 评估 


Smalltalk 在 促进 两 个 分 立 的 计算 、 图 形 用 户 接口 和 面 对 对 象 程序 设计 方面 做 出 了 巨大 的 贡 
献 。 现 在 在 软件 系统 的 用 户 界面 方面 占 统治 地 位 的 视窗 系统 来 自 于 Smalltalk 语 言 。 当 今 最 重要 
的 软件 设计 方法 学 和 程序 设计 语言 都 是 面向 对 象 的 。 虽 然 面向 对 象 语言 的 最 初 思想 来 自 于 
SIMULA 67， 但 正 是 Smalltalk 语 言 让 这 些 思想 趋向 成 熟 。 显 然 ，Smalltalk 语 言 对 于 计算 世界 的 
影 啊 是 深刻 的 ， 并 且 将 是 久远 的 。 

下 面 古 Smalltalk 语 言 中 类 定义 的 一 个 例子 : 

"Smalltalk Example Program" 


"The following is a class definition, instantiations of 
which can draw equilateral polygons of any number of sides" 


class name Polygon 
superclass Object 

instance variable names ourPen 

numSides 

sideLength 


"Class methods" 
"Create an instance" 
new 


A 


super new getPen 


"Get a pen for drawing polygons" 
getPen 


O ”很 显然 ， 方 法 调用 也 能 传递 数据 给 被 调用 方法 处 理 。 


W 
N 
“eh 
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ourPen <- Pen new defaultNib: 2 


“Instance methods" 
"Draw a polygon" 
draw 
numSides timesRepeat: [ourPen go: sideLength; 
turn: 360 // numSides] 


"Set length of sides" 
length: len 
sideLength <- len 


"Set number of sides" 
sides: num 
numSides <- num 


The ancestry of Smalltalk is shown in Figure 2.12. 


2.16 结合 命令 式 与 面向 对 象 的 特性 :C++ 


关于 C 语 言 的 由 来 曾 在 2.12 节 中 讨论 过 ，Smalltalk 的 由 来 在 2.15 节 中 讨论 过 。C++ 语 言 是 在 
C 的 基础 上 建立 起 语言 机 制 ， 用 以 支持 大 部 分 由 Smalltalk 所 开创 的 语言 功能 。C++ 是 对 C 进 行 一 
系列 的 修改 发 展 而 来 ， 它 改进 了 原 有 的 命令 式 语言 特性 ， 并 且 增加 了 支持 面向 对 象 程序 设计 的 
语言 结构 。 


2.16.1 设计 过 程 


丛 C 迎 问 C++ 的 第 一 步 是 1980 年 由 Bjarne Stroustrup 在 贝尔 实验 室 完 成 的 。 这 次 修改 包括 
了 增加 函数 参数 的 类 型 检测 以 及 转换 ， 意 义 尤 其 重大 的 是 ， 增 加 了 与 SIMULA 67 和 Smalltalk 
中 的 类 相似 的 类 。 增 加 部 分 还 包括 了 派生 类 、 对 被 继承 部 分 的 公用 与 私有 访问 的 控制 、 构 造 
图 数 与 析 构 函数 方法 以 及 友 元 类 。1981 年 还 增加 了 内 联 函 数 、 默 认 参 数 以 及 赋值 运算 符 的 重 
载 。 这 样 产 生 的 语言 被 称 为 是 “具有 类 的 C 语 言 ”， 并 在 Stroustrup 的 文章 中 给 予 了 描述 
(Stroustrup, 1983), 

理解 这 种 “具有 类 的 C 语 言 ”的 目标 ， 将 是 有 帮助 的 。 当时 的 主要 目标 是 要 提供 一 种 能 
像 SIMULA 67 那 样 运用 类 与 继承 来 组 织 程序 的 语言 。 它 的 第 二 个 重要 目标 是 类 的 加 入 不 应 该 使 
它 的 性 能 受到 影响 ， 即 它 的 性 能 不 应 该 比 C 差 。 例 如 ， 设 有 考虑 对 修改 数组 下 标 范 围 的 检测 ， 
因为 这 样 可 能 会 导致 相对 于 C 的 较 大 的 性 能 差异 。 第 三 个 目标 是 将 “具有 类 的 C 语 言 ” 用 于 所 有 
能 够 使 用 C 的 应 用 之 中 ， 实 际 上 ，C 的 任何 特性 都 没有 被 删除 ， 甚至 包括 那些 已 经 被 认为 是 不 安 
全 的 特性 。 

到 1984 年 之 前 ， 这 种 语言 又 得 到 了 扩展 ， 包括 了 一 些 虚 拟 方法 以 提供 方法 调用 与 特殊 方法 
定义 之 间 的 动态 绑 定 ， 方 法 名 与 运算 符 重 载 以 及 引用 类 型 。 该 语言 的 这 个 版 本 被 称 为 CH+， 它 
由 Stroustrup 给 予 了 描述 (Stroustrup, 1984) 。 

在 1985 年 ，C++ 的 第 一 次 可 应 用 的 实现 问世 了 ， 这 是 一 个 被 命名 为 Cfront 的 系统 。 这 个 系统 
将 C++ 程序 翻译 成 C 程序 。 Cfront 系 统 的 这 个 版 本 与 它 所 实现 的 C++ 版 本 一 起 被 命名 为 “Release 
1.0”, Release 1.0 由 Stroustrup 描 述 (Stroustrup, 1986), 

从 1985 年 到 1989 年 之 间 ， 在 很 大 程度 上 是 基于 用 户 对 首次 公布 的 C++ 实现 版 本 的 反应 ， 


C++ 语言 继续 发 展 ， 产 生 了 被 命名 为 “Release 2.0” 的 第 二 个 版 本 。 这 个 版 本 的 Cfront 的 实现 于 
1989 年 6 月 推出 。C++ Release 2.0 中 增加 的 最 重要 特性 是 支持 多 重 继承 (具有 超过 一 个 父 类 的 类 ) 
与 抽象 类 ， 以 及 其 他 一 些 方面 的 增强 。 关 于 抽象 类 将 在 第 12 章 里 描述 。 

C++ Release 3.0 于 1989 年 至 1990 年 期 间 继续 演进 。 这 个 版 本 增加 了 提供 参数 化 类 型 的 模板 
以 及 异 第 处 理 。 于 1998 年 标准 化 的 C++ 的 当前 版 本 由 ISO 描 述 (ISO, 1998), 

在 2002 年 ， 微 软 公司 公布 了 它 的 .NET 计 算 平 台 ， 其 中 包括 C++ 语言 的 一 种 新 版 本 ， 称 为 
“ 受 控 的 C++ 语 言 ”(Managed C++) ， 或 者 称 为 MC++。MC++ 扩 展 了 C++ 语言 ， 用 以 提供 对 
于 .NET 框 架 功 能 的 访问 。 这 种 扩展 了 的 语言 还 包括 了 性 质 (property)、 委 托 (delegate)、 接 口 
以 及 一 种 用 于 垃圾 收集 对 象 的 引用 类 型 。 第 11 章 讨论 性 质 ， 第 2.19 节 引入 委托 。 因 为 .NET 不 支 
持 多 重 继承 ，MC++ 也 不 支持 。 


2.16.2 语言 概述 


C++ 语言 包括 了 两 种 定义 类 型 的 结构 : 类 及 struct， 而 这 两 种 结构 之 间 并 没有 什么 差别 。 实 
际 上 ， 包 括 方法 定义 的 struct 已 经 很 少 使 用 。C++ 支 持 多 重 继承 。 在 C++ 中 ， 通 常 称 方法 为 成 员 
Kt (member functions), | 

因为 C++ 语言 既 包 括 了 国 数 又 包括 了 方法 ， 所 以 这 种 语言 同时 支持 过 程式 程序 设计 和 面向 
对 象 的 程序 设计 。 

C++ 中 的 运算 符 可 以 重 载 ， 这 意味 着 用 户 可 以 在 针对 已 有 用 户 定义 类 型 的 运算 符 上 创建 新 
的 运算 符 。C++ 中 的 方法 也 可 以 重 载 ， 这 意味 着 用 户 可 以 使 用 同一 个 名 字 来 定义 多 个 方法 ， 只 
要 它们 的 参数 数目 或 者 参数 类 型 不 相同 。 

C++ 中 的 动态 绑 定 由 虚拟 方法 来 提供 。 这 些 方法 在 一 组 通过 继承 相关 联 的 类 中 使 用 重 载 方 
法 来 定义 依赖 于 类 型 的 操作 。 一 个 指向 类 A 的 对 象 的 指针 也 可 以 指向 以 类 A 为 前 辈 类 的 对 象 。 当 
这 个 指针 指向 一 个 重 载 虚 拟 方法 时 ， 可 以 动态 地 选择 当前 类 型 的 方法 。 

方法 与 类 都 可 以 被 模板 化 ， 这 意味 着 它们 可 以 被 参数 化 。 例 如 ， 可 以 将 一 个 方法 写成 模板 
化 方法 ， 以 允许 它 能 够 具有 多 个 参数 类 型 的 不 同 版 本 。 类 也 具有 同样 的 灵活 性 。 

C++ 所 包括 的 异常 处 理 与 Ada 语 言 有 着 重大 的 不 同 , 其 中 之 一 是 不 能 处 理 硬件 可 检测 的 异常 。 
Adal 以 及 C++ 语言 的 异常 处 理 结构 将 在 第 14 章 中 讨论 。 


2.16.3 评估 


C++ 很 快 就 成 为 一 种 非常 受 欢迎 的 语言 ， 而 且 这 种 形势 一 直 保持 着 。 使 得 它 广 为 应 用 的 一 
个 因素 是 它 价 廉 物 美的 编译 器 。C++ 受 欢迎 的 另 一 个 因素 是 它 几 乎 完全 与 C 向 后 兼容 (这 意味 着 ， 
只 要 作 少 许 改 变 ， 就 可 以 将 C 程 序 作 为 C++ 程序 来 编译 ) ， 而 且 在 大 多 数 实 现 中 ， 可 以 将 C++ 的 
代码 与 C 的 代码 相 链 接 一 一 因而 许多 C 程 序 人 员 掌 握 C++ 相 对 容易 。 最 后 一 点 ， 当 C++ 语言 刚刚 
出 现时 ， 面 向 对 象 程序 设计 也 开始 受到 人 们 的 广泛 关注 ， 而 C++ 是 当时 唯一 适合 于 大 型 商业 软 
件 项 目的 语言 。 

至 于 C++ 语 言 的 缺点 ， 因 为 它 是 一 种 十 分 庞大 而 复杂 的 语言 ， 显 然 它 也 有 着 与 PL/I 语 言 类 
似 的 缺点 。 它 继承 了 C 语 言 中 的 大 部 分 不 安全 因素 ， 这 使 得 C++ 没 有 Ada 和 Java 之 类 的 语言 安全 

我 们 将 在 第 12 章 里 对 C++ 语言 面向 对 象 的 语言 特性 进行 更 详细 的 描述 。 


2.16.4 一 种 相关 语言 ，Eiffel 


Eiffel 是 另 一 种 命令 式 与 面向 对 象 的 语言 特性 相 混合 的 语言 (Meyer，1992)。Eiffel 是 由 
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Bertrand Meyer 一 个 人 设计 的 。Bertrand Meyer 是 住 在 美国 加 州 的 法 国人 。 这 种 语言 包括 了 支 
持 抽 象 数 据 类 型 、 继 承 以 及 动态 绑 定 的 语言 特性 ;因而 它 能 够 全 面 地 支持 面向 对 象 的 程序 设 
计 。 也 许 Eiffel 语 言 中 最 显著 的 语言 特性 是 使 用 断言 来 强制 实施 子 程序 及 其 调用 之 间 的 “合约 ”。 
这 种 设计 思想 最 初 产 生 于 Plankalkiil 语 言 ， 但 被 大 多 数 后 来 设计 的 语言 所 忽略 。 我 们 会 自然 地 
将 Eiffel 与 C++ 进行 比较 。Eiffel 比 C++ 短小 而 简单 ， 但 几乎 具有 与 C++ 等 同 的 表达 性 和 可 写 性 。 
之 所 以 C++ 的 应 用 极为 广泛 ， 而 Eiffel 的 应 用 十 分 有 限 ， 其 中 原因 不 难 确定 。C++ 显 然 是 许多 
软件 开发 组 织 转向 面向 对 象 程 序 设计 的 最 容易 的 途径 ， 因 为 在 大 多 数 情 况 下 ， 它 们 的 开发 人 
员 已 经 掌握 了 C。Eiffel 就 没有 享有 这 样 容易 被 采纳 的 路 径 。 另 外 ， 在 C++ 开 始 传播 的 前 几 年 ， 

Cfront 系统 随手 可 得 而 且 十 分 便宜 。 而 在 Eiffel 的 最 初 几 年 ，Eiffel 的 编译 器 就 不 那么 容易 得 
到 并 且 较 为 昂贵 。C++ 享 有 声望 极 高 的 贝尔 实验 室 的 支持 ， 而 Eiffel 只 是 由 Bertrand Meyer 个 
人 与 他 的 相对 小 型 的 软件 公司 一 一 交互 式 软件 工程 公司 (Interactive Software Engineering) 
来 支持 。 


2.16.5 另 一 种 相关 语言 ， Delphi 


Delphi 是 一 种 混合 式 语 言 。 类 似 于 C++， 它 的 产生 是 通过 增加 面向 对 象 的 支持 以 及 一 些 
其 他 特性 到 现 有 的 命令 式 语言 之 上 。Delphi 是 从 Pascal 演 变 而 来 。Delphi 与 C++ 之 间 的 许多 
老 别 来 目 它 们 各 自 的 前 辈 语 言 ， 以 及 导致 产生 它们 的 不 同 程序 设计 文化 环境 。 因 为 C 是 一 种 
功能 强大 但 具有 不 安全 性 的 语言 ，C++ 也 有 着 同样 的 特征 ， 至 少 它 在 如 下 方面 是 不 安全 的 ; 
数组 的 下 标 检 测 、 指 针 的 算术 运算 以 及 数值 类 型 的 强制 转换 。 同 样 地 ， 因 为 Pascal 语 言 比 C 
安全 ，Delphi 也 比 C++ 更 为 安全 ， 并 且 Delphi 也 没有 C++ 语 言 那 么 复杂 。 例 如 ，Delphi 语 言 
不 允许 用 户 定义 的 运算 符 重 载 ， 不 允许 通用 子 程序 ， 也 不 允许 参数 化 的 类 ， 而 这 些 都 是 C++ 
的 组 成 部 分 。 

Delphi 像 C++ 一 样 ， 给 开发 人 员 提 供 了 图 形 用 户 界面 (GUI)， 并 提供 了 给 由 Delphi 语 言 所 编 
写 的 应 用 产生 图 形 用 户 界 面 的 简单 方式 。Delphi 语 言 的 设计 者 Anders Hejlsberg 先 前 曾经 开发 了 
Turbo Pascal 系 统 。 他 所 开发 的 Delphi 语 言 以 及 Turbo Pascal 系 统 都 由 Borland 公 司 销售 与 发 行 ， 
Hejlsberg 也 是 C# 语 言 的 主要 设计 人 员 。 


2.17 一 种 基于 命令 式 的 面向 对 象 语言 : Java 


Java 语 言 的 设计 人 员 开 始 从 C++ 中 删除 了 大 量 的 结构 ， 修 改 了 一 些 结构 ， 又 增加 了 另外 一 些 
结构 。 这 样 所 产生 的 语言 ， 具 有 C++ 语言 的 强大 功能 与 灵活 性 ， 同 时 又 更 为 小 巧 、 简 单 和 安全 。 


2.17.1 设计 过 程 


Java 也 像 许多 程序 设计 语言 一 样 ， 是 针对 某 种 应 用 而 设计 的 ， 而 当时 显然 没有 现成 又 满足 
需要 的 语言 ， 然 而 Java 语 言 实际 上 却 是 针对 一 系列 的 应 用 而 设计 的 ， 其 中 第 一 类 应 用 是 在 家 用 
电子 装置 上 进行 戏 入 式 程序 设计 ， 例 如 吐 司 炉 、 微 波 炉 和 交互 式 电视 系统 。 看 起 来 ， 似 乎 一 全 
微波 炉 软 件 的 可 靠 性 不 至 于 成 为 重要 因素 。 如 果 一 台 微波 炉 的 软件 发 生 故 障 似乎 不 大 可 能 对 任 
何人 造成 致命 的 威胁 ， 也 不 至 于 引起 重大 的 法 律 纠纷 。 但 是 ， 如 果 某 种 型 号 上 的 软件 有 错误 ， 
而 在 一 百 万 个 这 种 型 号 的 产品 已 经 被 制造 并 售 出 之 后 才 发 现 ， 这 时 再 收回 这 些 产品 必 将 带 来 极 

[97] 其 重大 的 损失 。 因 此 ， 在 消费 性 电子 产品 的 软件 中 ， 可 靠 性 仍然 是 一 个 重要 特征 ， 
在 1990 年 ，Sun 公 司 (Sun Microsystems) 已 经 确信 ， 他 们 考虑 的 两 种 程序 设计 语言 C 和 C++， 
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都 不 满足 Sun 公 司 在 家 用 电子 装置 中 开发 软件 的 需要 。 尽 管 C 相 对 地 精炼 ， 但 它 不 提供 面向 对 象 
程序 设计 的 支持 ， 而 他 们 认为 这 是 必需 的 语言 特征 。C++ 虽 然 支持 面向 对 象 的 程序 设计 ， 但 他 
们 判定 这 种 语言 过 于 庞大 和 复杂 ， 其 中 部 分 原因 是 因为 C++ 也 支持 面向 过 程 的 程序 设计 。 他 们 
还 相信 ，C 与 C++ 语言 都 不 能 提供 所 要 求 的 可 靠 程度 。Java 语 言 的 设计 由 这 样 的 基本 信念 所 指导 : 
它 应 该 具有 比 C++ 语言 所 能 够 提供 的 更 好 的 简单 性 和 可 靠 性 。 

尽管 推动 Java 设 计 的 原始 动力 是 家 用 电子 产品 ， 但 是 早期 配备 了 Java 程 序 的 这 类 产品 从 没有 
被 销售 出 来 。 从 1993 年 开始 ， 因 为 出 现 了 大 量 新 的 图 形式 浏览 器 ， 万 维 网 开始 被 广泛 使 用 ， 这 
时 人 们 才 发 现 Java 是 网 络 程 序 设 计 的 一 种 有 用 工具 。 尤 其 是 ， 相 对 小 巧 的 Java 程 序 Java applet 输 
出 效果 能 显示 在 Web 文 档 中 ， 所 以 在 20 世 纪 90 年 代 中 期 很 快 就 流行 了 起 来 。 在 万 维 网 被 公开 使 
用 的 最 初 几 年 ， 它 成 为 Java 语 言 最 前 见 的 应 用 领域 。 

Java 设 计 小 组 由 James Gosling 领 导 ， 他 先前 曾经 设计 过 UNIX 系 统 的 emacs 编 辑 器 与 NeWS 
视窗 系统 。 


2.17.2 语言 概述 


如 前 所 述 ，Java 是 以 C++ 为 基础 的 ， 但 又 特别 设计 得 更 加 小 巧 、 简 单 和 可 靠 。Java 兼 有 类 与 
基本 类 型 ， 这 一 点 如 同 C++ 中 的 一 样 。Java 的 数组 是 预定 义 的 类 的 实例 ， 而 C++ 中 的 数组 则 不 是 ， 
尽管 有 许多 C++ 的 使 用 人 员 为 数组 建立 起 封装 类 ， 以 便 增加 下 标 范围 检测 这 样 的 特性 。 而 这 样 
的 语言 特性 在 Java 中 是 隐 含 的 。 

Java 语 言 没 有 指针 ， 但 它 的 引用 类 型 提供 了 指针 的 一 些 功 能 。 这 些 引用 被 用 来 指向 类 的 实 
例 ， 而 事实 上 ， 这 是 引用 类 的 实例 的 唯一 方法 。 所 有 对 象 都 在 堆 上 被 分 配 。 尽 管 指针 与 引用 表 
面 上 似乎 极其 相像 ， 但 它们 之 间 在 语义 上 却 有 一 些 重大 不 同 。 指 针 指 向 存储 单元 的 地 址 ， 但 引 
用 指 问 对 象 。 这 使 得 对 引用 进行 任何 算术 运算 都 毫 无 意义 ， 从 而 避免 了 一 些 容易 出 错 的 做 法 。 
区 分 指针 的 值 与 指针 所 指向 的 值 之 间 的 差别 ， 在 大 多 数 语言 中 是 程序 人 员 的 责任 ， 这 时 常常 必 
须 将 指针 显 式 间接 引用 (dereference)。 然 而 在 必要 的 时 候 ，3 引 用 总 是 隐 式 间接 引用 ， 因 而 引用 
的 行为 更 接近 普通 的 标量 变量 。 

Java 具 有 一 个 基本 布尔 类 型 (boolean ) ， 主 要 用 于 控制 语句 中 的 控制 表达 式 (如 在 if 和 
while 语 句 中 )。 与 C 和 C++ 语言 不 同 ，Java 里 的 算术 表达 式 不 能 够 用 来 作为 控制 表达 式 。 

Java 与 更 早 、 支 持 面 各 对 象 程序 设计 的 语言 (包括 C++) 之 间 的 另 一 个 重要 区 别 ， 是 在 Java 
中 不 能 够 编写 独立 的 子 程序 。Java 中 所 有 子 程 序 都 是 定义 于 类 之 中 的 方法 。 此 外 ， 任 何 对 于 方 
法 的 调用 只 能 通过 类 或 者 对 象 。 这 种 方式 的 结果 就 是 ，Java 只 能 够 支持 面向 对 象 的 程序 设计 ， 
而 C++ 则 能 够 支持 面向 过 程 以 及 面向 对 象 的 程序 设计 。 

C++ 与 Java 之 间 的 另外 一 个 重要 区 别 ， 是 C++ 在 它 的 类 定义 中 直接 支持 多 重 继承 。 有 些 人 认 
为 多 重 继承 带 来 过 多 的 复杂 性 与 混乱 ， 因 而 不 值得 采用 。Java 仅 仅 支 持 类 的 单 继承 ， 但 通过 使 
用 Java 语 言 中 的 接口 结构 ， 能 够 获得 一 些 多 重 继承 的 优点 。 

C++ 的 结构 中 没有 被 Java 语 言 复 制 的 是 stzruct 和 union。 

Java 语 言 通过 它 的 同步 (synchronize) 修饰 符 包 括 了 一 种 相对 简单 的 并 发 控制 形式 。 这 种 
并 发 控制 能 够 出 现在 它 的 方法 与 块 结构 中 。 这 给 方法 与 块 结构 附加 了 一 把 锁 ， 而 这 种 锁 保证 了 
互 斥 访问 或 互 斥 执行 不 至 于 发 生 。 在 Java 语 言 中 产生 并 发 进程 相对 容易 ， 并 发 进程 在 Java 语 言 
中 被 称 为 线程 。 

Java 隐 式 解 除 对 对 象 的 存储 空间 分 配 ， 这 通常 被 称 为 垃圾 收集 。 有 了 垃圾 收集 ， 程 序 员 就 
不 必 显 式 地 删除 不 再 需要 的 对 象 。 没 有 垃圾 收集 的 语言 所 编写 的 程序 经 常 出 现 所 谓 内 存 泄漏 的 
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问题 ， 这 个 问题 指 的 是 ， 被 分 配 了 的 存储 单元 从 来 没有 被 解除 分 配 ， 最 终 将 耗 尽 所 有 的 存储 空 
间 。 

不 同 于 C 与 C++ 语言 ，Java 中 的 赋值 类 型 强制 转换 ( 隐 式 类 型 转换 ) 仅仅 允许 类 型 转换 的 
“ 宽 化 ”( 即 从 一 种 较 “ 小 ”的 类 型 转换 为 一 种 较 “ 大 ”的 类 型 )， 因 而 可 以 通过 赋值 运算 符 完成 
从 int 到 float 的 强制 类 型 转换 ， 但 不 能 完成 从 float 到 int 的 强制 类 型 转换 。 


2.17.3 评估 


Java 的 设计 人 员 在 剪裁 C++ 中 多 余 的 以 及 /或 者 不 安全 的 特性 方面 做 了 很 出 色 的 工作 。 例 如 ， 
从 C++ 中 的 赋值 强制 转换 里 删 掉 一 半 ， 这 显然 是 迈 向 更 高 可 靠 性 的 一 步 。 数 组 下 标 范 围 的 索引 
检测 也 使 得 语言 更 为 安全 。 而 增加 并 发 功能 则 更 扩大 了 语言 的 应 用 范围 。 增 加 下 列 功能 也 达到 
了 同样 的 功效 ， 如 小 应 用 程序 (applet) 类 库 、 图 形 用 户 界 面 、 数 据 库 的 访问 以 及 网 络 化 。 

Java 的 可 移植 性 ， 至 少 是 以 中 间 代 码 的 形式 ， 常 常 被 人 们 归功 于 Java 的 语言 设计 ， 其 实 却 
不 然 。 任 何 语言 都 可 以 被 翻译 成 中 间 代 码 的 形式 ， 并 且 能 够 “运行 ”于 任何 适 于 这 种 中 间 形 式 
的 虚拟 机 器 平台 上 。 这 种 可 移植 性 的 代价 便 是 解释 的 代价 ， 传 统 上 解释 的 代价 大 约 比 机 器 码 运 
行 的 代价 高 一 个 数量 级 。Java 解 释 器 的 最 初版 本 被 称 为 Java 虚 拟 机 (Java Virtual Machine, JVM), 
它 至 少 比 功能 类 似 的 编译 的 C 程序 慢 十 倍 。 然 而 ， 现 在 的 Java 程 序 在 执行 之 前 被 翻译 成 为 机 器 
代码 ， 使 用 即时 编译 器 (Just In Time，JIT) ， 这 使 得 Java 程 序 的 效率 已 经 可 以 与 编译 式 语言 
(如 C++) 的 程序 不 相 上 下 。 

Java 语 言 应 用 的 增长 速度 远 超过 任何 其 他 的 程序 设计 语言 。 最 初 是 因为 它 在 动态 万 维 网 程 
序 设计 方面 的 价值 。 另 一 个 原因 则 是 由 于 Java 的 编译 器 /解释 器 系统 是 免费 的 ， 而 且 从 万 维 网 上 
获取 十 分 容易 。 而 Java 语 言 迅 速 升 至 显著 位 置 的 最 主要 原因 就 在 于 程序 人 员 喜 欢 它 的 设计 。 总 
有 一 些 开 发 人 员 认 为 ，C++ 语 言 过 于 庞大 与 复杂 ， 不 便于 使 用 ， 还 不 够 安全 。 Java 给 他 们 提供 
了 一 种 替代 方案 ， 它 具有 C++ 的 大 部 分 功能 ， 但 更 为 简单 与 安全 。 今 天 ，Java 语 言 已 经 被 广泛 
地 用 于 各 种 各 样 的 应 用 领域 。 

最 近 的 Java 语 言 版 本 增加 了 一 些 重要 内 容 。 这 个 版 本 出 现 于 2004 年 ， 最 初 被 称 为 Java 1.5, 
后 来 又 被 称 为 Java 5.0。 新 增 的 内 容 包括 一 种 枚 举 类 、 一 些 通用 结构 ， 以 及 一 种 新 的 循环 结构 ， 

下 面 是 Java 程 序 的 一 个 例子 : 


// Java Example Program 
// Input: An integer, listlen, where listlen is less 


ra than 100, followed by length-integer values 
// Output: The number of input data that are greater than 
// the average of all input values 


import java.io.*; 
class IntSort { 
public static void main(String args[]) throws IOException { 
DataInputStream in = new DatainputStream(System.in); 
int listlen, 
counter, 
sum = 0, 
average, 
result = 0; 
int[] intlist = new int[99]; 
listlen = Integer.parseInt(in.readLine() ); 
if ((listlen > 0) && (listlen < 100)) { 
/* Read input into an array and compute the sum */ 
for (counter = 0; counter < listlen; counter++) { 
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intlist[counter] = 
Integer.valueOf(in.readLine()).intValue(); 
sum += intlist[counter]; 


} 
/* Compute the average */ 
average = sum / listlen; 
/* Count the input values that are > average */ 
for (counter = 0; counter < listlen; counter++) 
if (intlist[counter] > average) result++; 
/* Print result */ 
System.out.printin/( 
"\nNumber of values > average is:" + result); 
} //** end of then clause of if ((listlen > 0) ... 
else System.out.println/( 
"Error—input list length is not legal\n"); 
} //** end of method main 
} //** end of class IntSort 


2.18 脚本 语言 : JavaScript、PHP、Python 和 Ruby 


万 维 网 的 爆炸 性 发 展 发 生 于 20 世 纪 90 年 代 的 中 期 ， 第 一 个 图 形 浏览 器 出 现 之 后 。 由 于 
HTML 文 件 的 本 身 完全 是 静态 的 ， 因 而 与 HTML 文 件 相 关 的 计算 需要 很 快 就 成 为 了 关键 。 通 用 
网 关 接 口 使 得 在 服务 器 终端 上 的 计算 成 为 可 能 。 通 用 网 关 接口 (Common Gateway Interface, 
CGI) 允许 HTML 文 件 要 求 执 行 服务 器 上 的 程序 ， 又 将 这 种 计算 的 结果 以 HTML 文 件 的 形式 返回 
给 麟 览 融 。 而 Java 的 小 应 用 程序 的 出 现 ， 则 使 得 浏览 器 上 的 计算 成 为 了 现实 。 现 在 ， 这 两 种 方式 
都 逐步 被 一 些 更 新 的 技术 所 代替 ， 主 要 是 被 脚本 语言 所 代替 。 本 节 将 简略 地 讨论 两 种 最 流行 的 
脚本 语言 : JavaScript 语 言 ， 它 是 居于 HTML 文件 内 、 在 客户 机 上 运行 的 脚本 语言 ，PHP 语 言 ， 它 
是 居于 HTML 文 件 内 、 在 服务 器 上 运行 的 脚本 语言 。 本 节 还 将 简略 地 讨论 另外 两 种 脚本 语言 一 一 
Python 语言 和 Ruby 语 言 。Python 和 Ruby 不 是 仅仅 为 了 万 维 网 应 用 而 创建 的 ， 尽 管 它 通常 用 于 通 
用 网 关 接 口 的 程序 设计 。 

请 往 意 ，Perl 通 党 被 认为 是 一 种 脚本 语言 ， 但 事实 上 Perl 更 像 C 语 言 ， 而 不 像 典 型 的 脚本 语 
言 。Perl 语 言 在 2.12.3 节 里 讨论 。 


2.18.1 _ JavaScript 的 起 源 及 特征 


原名 为 LiveScript 的 JavaScript (Flanagan, 1998) 在 Netscape 开 发 产生 。1995 年 下 半年 ， 
LiveScript 语 言 成 为 Netscape 与 Sun 公 司 的 联合 事业 ， 并 被 改名 为 JavaScript。 通 过 增加 许多 新 的 
特性 及 功能 ，JavaScript 语 言 从 版 本 1.0 到 1.5 经 历 了 巨大 的 演变 。 JavaScript 语 言 的 标准 化 于 20 世 
纪 90 年 代 后 期 由 欧洲 计算 机 制造 业 协 会 (European Computer Manufacturers Association, ECMA) 
开发 ， 作 为 文件 ECMA-262。 这 种 标准 化 也 获得 了 国际 标准 化 组 织 (ISO) 的 批准 ， 为 文件 ISO- 
10202。 人 微软 公司 的 JavaScript 版 本 被 命名 为 JScript。 

尽管 可 以 将 JavaScript 解 释 器 戏 入 到 许多 不 同 的 应 用 之 中 ， 但 最 经 常 的 用 法 是 和 芷 入 Web 浏 览 
车 。JavaScript 代 码 戏 入 HTML 文档 ， 在 文档 显示 时 解释 执行 。 这 种 语言 在 万 维 网 中 的 主要 应 用 
是 确保 表单 输入 数据 的 正确 性 ， 以 及 HTML 文件 的 动态 产生 。 

虽然 它 的 名 称 为 JavaScript， 但 它 与 Java 语 言 的 关联 仅仅 是 它们 使 用 相 类 似 的 语法 。Java 是 
强 类 型 化 语言 ， 而 JavaScript 中 的 类 型 则 是 动态 的 (参见 第 5 章 )。JavaScript 的 字符 串 及 数组 都 具 
有 动态 长 度 。 正 是 因为 如 此 ，JavaScript 语 言 不 检测 数组 下 标的 有 效 性 ， 而 Java 语 言 则 要 求 检测 
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Java 语 言 全 面 地 支持 面向 对 象 的 程序 设计 ，JavaScript 则 既 不 支持 继承 ， 也 不 支持 方法 调用 与 方 
法 之 间 的 动态 绑 定 。 

JavaScript 语 言 的 一 个 最 重要 应 用 ， 是 动态 地 产生 与 修改 HTML 文 件 。JavaScript 定 义 一 个 对 
象 层 次 结构 ， 这 个 结构 与 文档 对 象 模型 (Document Object Model) 所 定义 的 HTML 文 件 的 层次 
模型 相 吻合 。 所 有 对 于 HTML 文 档 元 素 的 访问 都 必须 经 过 这 些 对 象 ， 这 提供 了 对 于 HTML 文档 
元 素 实 施 动态 控制 的 基础 。 

下 面 是 一 段 JavaScript 脚 本 的 例子 。 因 为 戏 入 在 HTML 文 件 之 中 ， 它 的 外 观 十 分 奇特 。 这 个 
程序 可 以 在 任何 装载 了 JavaScript 解 释 器 最 新 版 本 的 万 维 网 浏览 器 上 运行 。 


<?xml version="1.0" encoding="utf-8"?> 
<!DOCTYPE html PUBLIC "-//w3c//DTD XHTML 1.1 //EN" 
"http: //www.w3.org/TR/xhtml11/DTD/xhtmlll-strict.dtd"> 
<!-- example.html 
Input: An integer, listLen, where listLen is less 
than 100, followed by listLen-numeric values 
Output: The number of input values that are greater 
than the average of all input values 


<> 
<html Xmlns = "http://www.w3.org/1999/xhtm1"> 
<head><title> Example </title> 

</head> 

<body> 

<script type = "text/javascript"> 


SEA ete 
var intList = new Array(99); 
var listLen, counter, sum = 0, result = 0; 


listLen = prompt ( 
"Please type the length of the input list", ""); 
if ((listLen > 0) && (listLen < 100)) { 
// Get the input and compute its sum 
for (counter = 0; counter < listLen; counter++) { 
intList[counter] = prompt ( 
"Please type the next number", ""); 
sum += parseInt(intList[counter]); | 
} 
// Compute the average 
average = sum / listLen; 
// Count the input values that are > average 
for (counter = 0; counter < listLen; counter++) 
if (intList[counter] > average) result++; 
// Display the results 
document.write("Number of values > average is: ", 
result, "<br />"); 


} else 
document.write ( 
"Error - input list length is not legal <br />"); 
// --> 
</script> 
</body> 


</html> 
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2.18.2 PHP 的 起 源 及 特征 


PHP 语 言 (Converse 和 Park, 2000) 是 1994 年 由 Apache 小 组 的 一 个 成 员 Rasmus Lerdorf 所 开 
发 的 。 最 初 的 动机 是 想 给 Lerdorf 的 个 人 网 站 提供 一 种 工具 ， 以 便 帮 助 追踪 网 站 的 访问 者 。 在 
1995 年 ，Lerdorf 开 发 了 一 个 称 为 “个 人 网 页 工具 ”(Personal Home Page Tools) 的 软件 包 ， 这 个 
软件 包 成 为 了 首次 发 布 的 PHP 语 言 版 本 。 起 初 ， 名 称 PHP 是 英文 Personal Home Page ( 即 个 人 网 
页 ) 的 首 字母 ， 但 后 来 这 个 语言 的 用 户 群 体 开 始 称 之 为 PHP (超级 文本 预 处 理 器 ，Hypertext 
Preprocessor) ， 结 果 使 得 原来 的 名 称 反 而 被 人 遗忘 了 。 现 在 ，PHP 语 言 被 作为 开放 源 代码 (open- 
source) 产品 来 开发 、 发 布 以 及 被 支持 。PHP 处 理 器 是 大 多 数 万 维 网 服务 器 的 内 在 成 分 。 

PHP 是 专门 为 万 维 网 应 用 而 设计 的 ， 是 从 入 HTMIL 文 件 的 服务 器 端的 脚本 语言 。 当 万 维 网 
剂 览 器 请 求 一 份 嵌 入 了 PHP 代 码 的 HTML 文 件 时 ,万 维 网 服务 器 则 将 文件 中 的 PHP 代 码 进行 解释 。 
通常 ， PHP 代 码 所 产生 的 输出 为 HTML 文 件 的 代码 , 而 这 种 输出 将 替代 HTML 文 件 中 的 PHP 代 码 。 
因而 ， 万维网 浏览 器 端 从 来 就 不 会 看 见 PHP 代 码 。 

在 语法 的 表 观 ， 在 字符 串 和 数组 的 动态 特征 ， 以 及 使 用 动态 类 型 化 等 方 面 . PHP 语 言 与 
JavaScript 都 十 分 类 似 。PHP 语 言 的 数组 结合 了 JavaScript 的 数组 以 及 Perl 语 言 的 相关 数组 。 

早先 版 本 的 PHP 不 支持 面向 对 象 程序 设计 ， 但 是 在 第 二 个 发 布 版 就 支持 这 种 特性 了 。 然而 ， 
PHP 仍 然 不 支持 抽象 类 、 接 口 、 析 构 或 对 类 成 员 的 访问 控制 。 

PHP 人 允许 HIML 表 单数 据 的 简单 访问 ， 因而 PHP 的 表单 处 理 十 分 容易 。PHP 还 提供 了 对 于 多 
种 不 同 数据 库 管 理 系统 的 支持 ， 这 使 得 它 成 为 创建 万 维 网 数据 库 访 问 程序 的 优秀 语言 。 


2.18.3 Python 的 起 源 及 特征 


相对 而 言 ，Python (Lutz&Ascher, 2004) 是 一 种 更 新 的 、 面 向 对 象 的 解释 式 脚本 语言 。 它 
的 最 初版 本 是 由 Guido van Rossum 于 20 世 纪 90 年 代 初 在 荷兰 的 Stichting Mathematisch Centrum 
完成 设计 的 。 而 现在 的 开发 工作 是 由 “Python 软件 基金 协会 ”(Python Software Foundation) 承 
担 。Python 被 用 于 与 Perl 语 言 同类 型 的 应 用 领域 ， 系 统 的 行政 管理 通用 网 关 接 口 的 程序 设计 ， 
以 及 其 他 一 些 较 小 型 的 任务 。Python 是 一 种 开放 源 代码 系统 ， 并 且 存 在 于 多 数 一 般 计算 平台 上 。 
用 于 微软 视窗 系统 的 、 工业 标准 化 的 Python 语言 版 本 可 以 从 网 址 www.activestate.com/ 
Products/ActivePython 获 得 。 Python 在 其 他 一 些 计算 平台 上 的 实现 则 可 从 网 址 
www. python .org 获 得 ， 这 个 网 站 还 有 关于 Python 语 言 的 极为 丰富 的 信息 ，。 

Python 的 语法 没有 直接 以 任何 一 种 常用 的 语言 作为 基础 。 它 是 类 型 检测 的 ， 然而 是 动态 类 
型 化 的 语言 。Python 语 言 使 用 三 种 类 型 的 数据 结构 代替 了 数组 ， 表 、 BRAT (tuple) 的 不 
变 表 ， 以 及 被 称 为 字典 (dictionary) 的 散 列 。 Python 具 有 一 组 表 方 法 ， 如 append, insert， 
remove 以 及 sort。 Python 还 有 一 组 用 于 字典 的 方法 ， 如 keys, values, Copy 以 及 has key, 
Python 语言 也 支持 原来 属于 Haskell 语 言 的 表 领 悟 (list comprehension) , 天 于 表 领 司 ， 我 们 将 在 
第 15.8 节 讨论 。 

Python 是 面向 对 象 的 语言 ， 它 包括 了 Perl 语 言 的 模式 匹配 功能 ， 还 具有 异常 处 理 功 能 。 垃 专 
收集 在 对 象 不 再 使 用 时 回收 它们 。 

Python 语言 对 于 通用 网 关 接 口 的 支持 ， 尤 其 是 对 于 表单 处 理 的 支持 ， 是 由 cgi 模 块 来 提供 
的 。 支 持 cookie、 连 网 与 数据 库 访问 的 模块 也 是 Python 系统 中 的 部 分 ， 

一 个 更 有 趣 的 Python 语言 特性 是 任何 用 户 都 可 以 很 容易 地 扩展 这 种 语言 ， 可 以 使 用 任何 编 
译 式 语言 来 编写 支持 语言 扩展 的 模块 。 在 这 些 扩展 中 可 以 包括 函数 、 变 量 ， 以 及 一 些 对 象 类 型 。 
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7 . ple 


这 些 扩 展 被 实现 为 Python 语言 解释 器 的 附加 部 分 。 
2.18.4，Ruby 的 起 源 及 特征 


Ruby (Thomas et al., 2005) 是 Yukihiro Matsumoto (aka Matz) 在 20 世 纪 90 年 代 初 设计 并 于 
1996 年 发 布 的 一 种 语言 。 然 后 它 经 历 了 一 段 连 续 的 发 展 过 程 。Ruby 诞 生 的 动机 是 它 的 设计 者 对 
Perl 和 Python 的 不 满意 。 尽 管 Per 和 Python 都 支持 面向 对 象 程序 设计 ， 但 是 它们 都 不 是 完全 的 面 
加 对 象 程 序 设计 语言 ， 至 少 它们 都 包含 基本 类 型 ( 非 对象 ) 和 支持 函数 。 

像 Smalltalk 一 样 ，Ruby 的 基本 特性 是 完全 的 面向 对 象 程序 设计 。 每 个 数值 都 是 对 象 ， 所 有 
操作 都 必须 通过 方法 调用 来 完成 。Ruby 中 的 操作 符 只 是 用 来 完成 相应 操作 指定 方法 调用 的 句法 
机 制 。 由 于 它们 都 是 方法 ， 所 以 它们 都 能 被 重 定义 。 所 有 预定 义 和 用 户 定义 的 类 都 能 子 类 化 。 

在 Ruby 中 ， 类 和 对 象 都 是 动态 的 ， 这 意味 着 它们 能 动态 加 入 方法 。 同 时 ， 这 也 意味 着 在 每 
次 执行 期 间 ， 类 和 对 象 都 有 不 同 的 方法 集 。 因 此 ， 同 一 个 类 的 不 同 实例 呈现 不 同 的 行为 。 方 法 、 
数据 和 篆 量 都 能 包含 在 类 的 定义 中 。 

Ruby 的 语法 与 Eiffel 和 Ada 是 有 关联 的 。 不 需要 声明 变量 ， 因 为 使 用 了 动态 类 型 化 机 制 。 恋 
量 名 指定 了 其 作用 域 : 以 字母 开头 的 变量 具有 局 部 作用 域 ， 以 6 开头 的 变量 是 实例 变量 
(instance variable) ， 以 $ 开 头 的 变量 具有 全 局 作用 域 。 许 多 Perl 特 性 都 出 现在 Ruby 中 ， 包 含 隐 
eee, mS, 

因为 Ruby 的 易 用 性 ， 任 何 用 户 都 能 扩展 和 /或 修改 Ruby。Ruby 具 有 很 强 的 文化 趣味 ， 因 为 
它 是 第 一 种 由 日 本 人 设计 并 获得 广泛 应 用 的 程序 设计 语言 。 


2.19 一 种 基于 C 的 新 世纪 语言 C# 


在 2000 年 ， 微 软 公司 在 宣布 它 的 新 开发 平台 .NET 的 同时 9 也 推出 了 C# 语 言 。 在 2002 年 1 月 ， 
微软 发 布 了 这 两 种 新 产品 的 版 本 。 


2.19.1 设计 过 程 


C# 是 基于 C 和 Java 语 言 的 ， 但 也 包括 了 一 些 Delphi 以 及 Visual BASIC 的 思想 。C# 语 言 的 主 
要 设计 者 是 Anders Hejlsberg， 他 也 曾经 设计 过 Turbo Pascal 和 Delphi 语 言 ， 这 正 是 C# 部 分 地 继承 
Delphi 语 言 的 缘由 。 

C# 语 言 的 目标 是 要 为 基于 组 件 (component-based) 的 软件 开发 提供 一 种 语言 ， 尤 其 是 为 
在 :NET 框架 里 进行 的 开发 提供 语言 。 在 .NET 环 境 中 ,来 自 各 种 不 同 语言 的 组 件 可 以 很 容易 地 结 
合 起 来 形成 系统 。 所 有 .NET 的 语言 ， 包 括 C#，Visual Basic.NET, MC++, J#.NET 以 及 
JScript.NET， 都 使 用 “通用 类 型 系统 ” (Common Type System,，CTS)。 这 种 通用 类 型 系统 提供 
了 一 个 通用 的 类 库 。 这 五 种 .NET 语 言 中 的 所 有 类 型 都 继承 自 同 一 个 根 ， 即 System.Object， 
可 以 将 适合 通用 类 型 系统 规范 的 编译 器 产生 的 对 象 结合 进 软 件 系 统 。 所 有 五 种 .NET 的 语言 都 被 
编译 成 为 同一 种 中 间 形 式 ， 即 “中 间 语 言 ”(Intermediate Language, IL), © ii GJavaig SA 
同 的 是 ， 这 个 系统 从 来 不 对 “中 间 语 言 ” 进 行 解释 。 在 “中 间 语 言 ”被 执行 之 前 ， 即时 编译 器 
(Just-In-Time) 将 “中 间 语 言 ”翻译 成 为 机 器 代码 。 


日 ”关于 .NET 开 发 系统 ， 曾 经 在 第 1 章 里 简略 地 讨论 过 。 


© Ry), ILẸRĄMSIL (Microsoft Intermediate Language), 但 是 很 明显 ， 许多 人 认为 它 的 名 字 太 长 了 。 


2.19.2 语言 概述 


许多 人 相信 ，Java 语 言 比 C++ 优越 的 一 个 重要 之 处 ， 在 于 Java 语 言 删除 了 C++ 中 的 一 些 语言 
特性 。 例 如 ，C++ 支 持 多 重 继承 、 指 针 、stzructs、enum 类 型 、 运 算 符 重 载 以 及 goto 语 句 ， 
这 些 都 没有 包括 在 Java 语 言 中 。 而 C# 语 言 的 设计 人 员 显 然 不 同意 这 种 将 语言 特性 成 批 删除 的 方 
式 ， 他 们 将 上 面 列举 的 语言 特性 (除了 多 重 继 承 以 外 ) 重新 搬 回 了 新 的 语言 。 

然而 在 茶 些 情形 下 ，C# 语 言 的 设计 人 员 在 C# 版 本 中 改进 了 原来 Ct+ 的 语言 特性 。 例 如 ，C# 
中 的 enum 类 型 因为 不 能 够 隐 式 转换 成 整数 类 型 ， 从 而 比 在 C++ 中 的 enum 类 型 更 为 安全 。 这 使 
得 C# 中 的 enum 类 型 具有 类 型 安全 性 。C# 中 的 struct 类 型 也 经 历 了 重大 改变 ， 使 得 这 种 类 型 成 
为 了 一 种 真正 有 用 的 结构 ， 而 C++ 中 的 这 种 类 型 并 没有 实用 目的 。 在 C# 中 struct 是 一 种 轻型 
类 ， 它 不 支持 继承 或 子 类 。 然 而 C# 中 的 struct 可 以 实现 接口 ， 还 可 以 具有 构造 函数 ， 并 且 它 
们 是 数值 类 型 的 ， 这 意味 着 它们 是 在 运行 时 的 栈 上 分 配 和 直接 访问 ， 而 不 是 通过 引用 访问 。C# 
语言 中 的 所 有 基本 类 型 都 被 实现 为 struct。 

C# 语 言 试图 改进 C，C++ 以 及 Java 语 言 中 使 用 的 switch 语 句 ， 在 这 些 语言 中 ,由 于 可 选择 
代码 段 的 终端 不 存在 隐 式 分 支 ， 从 而 引起 了 大 量 的 程序 错误 。 在 C# 中 ， 每 个 非 空 的 case 段 必 
须 用 一 个 非 条 件 分 支 语 言 来 结束 。 因 而 ， 如 果 你 想 控 制 执行 流程 ， 从 一 个 case 段 到 下 一 个 
case 段 ， 就 必须 使 用 一 条 goto 语 句 来 分 支 。 

C# 语 言 包 括 了 函数 指针 ， 它 们 同样 具有 从 C++ 的 变量 指针 继承 的 不 安全 性 。C# 包 括 了 一 种 
新 的 类 型 一 一 代表 ， 它 是 面向 对 象 的 ， 也 是 类 型 安全 的 方法 引用 。 代 表 被 用 于 实现 事件 句柄 以 
及 回调 。” 在 Java 中 实现 的 回调 具有 接口 ， 而 在 C++ 中 的 回调 则 使 用 方法 指针 。 

在 C# 中 ， 方 法 可 以 具有 不 同 数目 的 参数 ， 但 这 些 参 数 必须 是 同一 种 类 型 。 这 通过 在 前 面 放 
置 保留 字 Params 的 数组 类 型 的 形式 参数 来 给 予 说 明 。 

C++ 与 Java 语 言 都 使 用 两 套 不 同 的 类 型 系统 ， 一 套用 于 基本 类 型 ， 另 外 一 套用 于 对 象 。 这 
除了 造成 混乱 之 外 ， 还 导致 经 常 需要 在 这 两 套 系统 之 间 进 行 数值 转换 ， 例 如 ， 将 基本 类 型 的 值 
放置 到 一 个 储存 了 对 象 的 组 合 之 中 。C# 通 过 隐 式 的 boxing 以 及 unboxing 操 作 提 供 了 在 这 两 
套 类 型 系统 则 半 隐 式 的 数值 转换 ， 关 于 这 些 ， 我 们 将 在 第 12 章 予以 讨论 。9 

其 他 的 C# 语 言 特性 还 有 长 方 数组 ， 大 多 数 的 程序 设计 语言 都 不 支持 这 个 特性 ， 还 有 一 条 
foreach 语 句 ， 它 是 数组 以 及 集合 对 象 的 迭代 器 。 在 Perl，PHP 以 及 Java 5.0 里 ， 都 可 以 找到 一 
条 类 似 的 foreach 语 句 。 男 外 ，C# 语 言 还 包括 了 属性 (property) ， 属 性 是 公有 数据 成 员 的 一 种 
蔡 代 。 将 属性 声明 为 具有 get 与 set 两 种 方法 的 数据 成 员 ， 当 对 相关 的 数据 成 员 进行 引用 或 者 
赋值 时 ， 则 隐 式 地 调用 属性 。 


2.19.3 评估 


C# 语 言 的 初衷 是 要 成 为 优越 于 C++ 和 Java 的 通用 程序 设计 语言 。 虽 然 对 于 它 的 某 些 特性 是 
合 在 倒退 可 能 具有 争议 ， 但 C#i 语 言 显 然 包含 了 超过 其 前 辈 语言 的 语言 结构 。C# 所 企 望 的 基本 应 
用 是 作为 ,NET 环境 中 的 一 种 主要 语言 。 要 说 C# 语 言 将 吸引 极 大 量 的 用 户 ， 现 在 还 为 时 过 早 。 然 
而 ， 在 微软 公司 销售 .NET 所 做 出 的 巨大 努力 的 前 提 之 下 ，C# 成 为 广泛 应 用 的 语言 有 着 极为 优越 
的 机 会 。 此 外 ， 它 的 一 些 语言 特性 肯定 会 被 将 来 的 程序 设计 语言 所 采纳 。 


曲 ” 当 一 个 对 象 调 用 另外 一 个 对 象 的 一 种 方法 ， 而 这 个 方法 完成 了 它 的 任务 而 需要 通知 那个 对 象 时 ， 此 时 就 将 调 
用 程序 再 调用 回来 。 这 种 调用 就 称 为 回调 。 
© Java 5.0 加 入 了 这 个 特性 。 
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下 面 是 C# 程 序 的 一 个 例子 : 


// C# Example Program 
// Input: An integer, listlen, where listlen is less than 


// ` 100, followed by listlen-integer values. 
// Output: The number of input values that are greater 
// than the average of all input values. 


using System; 
public class Ch2example { 
static void Main() { 
inti ] intlist: 
int listlen, 
counter, 
sum = 0, 
average, 
result = 0; 
intList = new int[99]; 
listlen = Int32.Parse(Console.readLiine()); 
if ((listlen > 0) && (listlen < 100)) { 
// Read input into an array and compute the sum 
for (counter = 0; counter < listlen; counter++) { 
intList[counter] = Int32.Parse(Console.readLine()); 
sum += intList[counter]; 
} //- end of for (counter ... 
// Compute the average 
average = sum / listlen; 
// Count the input values that are > average 
foreach (int num in intList) 
if (num > average) result++; 
// Print result 
Console.WriteLine( 
"Number of values > average is:" + result); 
} //- end of if ((listlen ... 
else 
Console.WriteLine ( 
"Error--input list length is not legal"); 
} //- end of method Main 
} //- end of class Ch2example 


2.20 标志 与 程序 设计 混合 式 语言 
标志 (markup) 与 程序 设计 混合 式 语言 是 一 种 标志 语言 ， 但 是 它 的 一 些 元 素 又 能 够 说 明 


茶 些 程序 设计 的 行为 ， 如 控制 程序 流程 以 及 运算 。 下 面 的 小 节 将 介绍 两 种 这 样 的 混合 式 语言 ， 
XSLT 与 JSP 语 言 。 


2.20.1 XSLT 


可 扩展 标志 语言 (eXtensible Markup Language, XML) 是 一 种 元 标志 语言 。 这 种 语言 被 用 
来 定义 标志 语言 ， 而 由 XML 派 生 的 标志 语言 则 用 来 定义 数据 文件 ， 这 些 数 据 文件 被 称 为 XME 文 
件 。 尽 管 XML 文 件 也 可 以 供 人 阅读 ， 但 主要 用 于 计算 机 处 理 。 有 时候 ， 这 种 处 理 只 是 将 文件 转 
换 成 为 一 种 能 够 高 效率 显示 或 打印 的 形式 。 但 更 多 的 时 候 ， 是 将 文件 转换 成 为 万 维 网 浏览 器 可 
以 显示 的 HTML 文 件 。 而 在 其 他 一 些 时 候 ， 则 是 处 理 文件 中 的 数据 ， 就 像 处 理 其 他 形式 的 数据 
文件 一 样 。 





一 种 专门 为 显示 转换 XML 文 件 的 方式 ， 是 使 用 另 一 种 标志 语言 一 一 可 扩展 样式 表 语 言 转换 
(eXtensible Stylesheet Language Transformations, XSLT) (www.w3.org/TR/XSLT), XSLT 的 
转换 可 以 声明 类 似 程序 设计 的 操作 。 因 而 ，XSLT 是 一 种 标志 与 程序 设计 混合 式 语言 。 在 20 世 纪 
90 年 代 的 后 期 ， 世 界 万 维 网 协会 《W3C) 给 予 了 XSLT 语 言 的 定义 。 

XSLT 处 理 器 是 一 个 程序 ， 它 接受 XML 数据 文件 和 XSLT 文 件 〈 它 也 是 一 种 XML 文件 的 形 
式 ) 作为 输入 。 在 这 种 处 理 过 程 中 ， 它 使 用 在 XSLT 文 件 里 所 声明 的 转换 将 XML 数据 文件 转 
换 成 为 另外 一 种 XML 文件 。”XSLT 文 件 通过 定义 模板 来 声明 这 种 转换 ， 这 些 模板 是 一 些 数 
据 的 模式 ， 而 XSLT 语 言 的 处 理 器 能 够 在 XML 输入 文件 中 找到 这 些 数 据 模 式 。 与 XSLT 文 件 中 
的 每 一 个 模板 相关 联 的 是 它 的 转换 指令 ， 这 些 指 令 说 明 在 将 这 些 匹 配 的 数据 放 入 输出 文件 之 
前 ， 如 何 将 这 些 数 据 进行 转换 。 因 而 ， 这 些 模 板 (及 其 相关 联 的 处 理 过 程 ) 具有 子 程序 的 行 
为 ， 当 XSLT 处 理 絮 发 现 XML 文 件 中 的 数据 与 一 个 模式 相 匹 配 ， 就 会 “执行 ”这 个 所 谓 的 
子 程序 。 

XSLT 语 言 也 具有 低层 次 的 程序 设计 结构 。 例 如 ， 它 包括 了 一 种 循环 结构 ， 这 个 结构 允许 选 
择 XMIL 文 件 中 重复 的 部 分 。 它 还 具有 排序 的 过 程 。 可 以 使 用 一 些 XSLT 的 标记 来 声明 这 些 低层 
次 的 结构 ， 例 如 <for-each>。 


2.20.2 JSP 


JavalkS ar Wl pteprice (Java Server Pages Standard Tag Library, JSTL) 的 核心 部 分 是 
男 一 种 标志 与 程序 设计 混合 式 语言 ， 尽 管 这 种 语言 的 形式 以 及 自 标 与 XSLT 语 言 十 分 不 同 。 在 讨 
论 JSTL 语 言 之 前 ， 有 必要 介绍 Servlet 以 及 Java 服 务 器 页 面 (Java Server Pages) 的 思想 。servlet 
是 一 种 内 居于 并 且 运 行 于 万 维 网 服务 器 的 Java 类 。servlet 的 执行 源 于 万 维 网 浏览 器 所 显示 的 标志 
文件 发 出 请 求 。 而 servlet 的 输出 以 HTML 文 件 的 形式 返回 到 提出 运行 请 求 的 浏览 器 上 。 运 行 于 万 
维 网 服务 器 进程 中 的 一 个 程序 称 为 Servlet 容 器 (Servlet container) ， 它 控制 着 Servlet 的 执行 。 
Servlet 通 稼 被 用 于 表格 的 处 理 以 及 数据 库 的 访问 。 

JSP 语 言 是 一 组 设计 技术 ， 被 用 于 支持 动态 的 万 维 网 文件 ， 以 及 提供 万 维 网 文件 处 理 的 其 

JSP 文 件 通 前 是 HTML 文件 与 Java 程 序 的 混合 ， 当 浏览 器 请 求 一 份 JSP 文 件 时 ， 内 居于 服务 
” 厂 系 统 的 JSP 处 理 程序 将 这 份 文件 转换 成 为 一 个 Servlet。 而 将 文件 中 所 艇 入 的 Java 代 码 复制 到 
Servlet 上 。 纯 HTML 则 被 原封 不 动 地 复制 到 Java 输 出 语句 之 中 。 如 下 面 的 段落 将 要 讨论 的 ，JSP 
文件 中 的 JSTL 标 志 也 被 处 理 。JSP 处 理 器 所 产生 的 Servlet 由 Servlet 容 器 来 运行 。 

JSTL 语 言 定义 了 一 组 XML 行动 元 素 ， 它 们 控制 服务 器 上 的 JSP 文 件 的 处 理 。 这 些 元 素 的 形 
式 与 HTML 或 XML 中 的 元 素 相同 。 一 种 最 常用 的 JSTL 控 制 行动 元 素 是 i£f， 它 说 明了 作为 属性 
的 布尔 表达 式 。 只 有 当 布 尔 表 达 式 的 值 为 真 时 ，if 元 素 的 内 容 (在 开始 标志 <if> 与 结尾 标志 
</if> 之 间 的 文字 ) 则 是 放 入 输出 文件 中 的 标志 代码 。 这 个 if 元 素 与 C/C++ 语言 中 的 #if 预 处 
理 亿 相关 联 。JSP 的 容器 处 理 JSP 文 件 的 JSTL 标 志 部 分 ， 与 C/C++ 语言 中 的 预 处 理 器 处 理 C/C++ 
程序 的 方式 相 类 似 。 预 处 理 器 的 命令 是 指示 预 处 理 器 以 说 明 如 何 从 输入 文件 来 构造 输出 文件 。 
同样 ，JSTL 的 控制 行动 元 素 是 对 JSP 处 理 器 发 出 指令 ， 以 说 明 如 何 从 输入 的 XML 文件 来 构造 
XML 输出 文件 。 

if 元 素 的 一 种 通常 用 法 是 验证 浏览 器 上 用 户 所 传送 的 表单 数据 的 有 效 性 。JSP 处 理 器 能 


O XSLT 处 理 器 的 输出 文件 也 可 以 是 HTML 文 件 的 形式 ， 或 者 一 般 文 件 的 形式 。 
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获取 表单 数据 ， 并 且 能 够 使 用 if 元 素 进行 测试 ， 以 保证 数据 的 合理 性 。 如 果 这 些 数 据 不 合理 ， 
if 元 素 将 为 用 户 在 输出 文件 中 插入 出 错 信息 。 

JSTL 语 言 有 choose, when 和 otherwise 元 素 ， 用 于 多 选择 控制 。JSTL 语 言 还 包括 一 个 
forEach 元 素 用 于 集合 循环 ， 集 合 通常 是 来 自 客 户 的 表单 值 。forEach 元 素 可 以 包括 begin， 
end 和 step 属 性 来 控制 循环 。 


小 结 


我 们 探讨 了 许多 种 最 重要 的 程序 设计 语言 的 发 展 ， 以 及 它们 的 开发 环境 。 读 者 们 应 该 已 经 从 这 一 章 
里 获得 对 于 当前 语言 设计 问题 的 正确 观点 。 我 们 希望 所 有 的 这 些 能 够 为 深入 讨论 当代 程序 设计 语言 的 重要 
特性 打下 基础 。 


文献 注释 


也 许 ， 关 于 程序 设计 语言 发 展 历史 资料 的 最 重要 来 源 是 由 Richard Wexelblat 所 编辑 的 History of 
Programming Languages (Wexelblat, 1981) 一 书 。 这 本 书包 括 了 13 种 重要 程序 设计 语言 的 开发 背景 与 开 
发 环境 ， 而 且 都 是 语言 设计 人 员 自 己 叙 述 的 故事 。 一 本 与 此 相 类 似 的 著作 来 源 于 第 二 次 “历史 性 ”的 会 议 ， 
这 次 出 版 了 ACM SIGPLAN Notices (ACM, 1993a) 的 一 一 个 特集 。 在 这 一 著作 中 ， 对 13 种 程序 设计 语言 
历史 及 演化 进行 了 讨论 。 

Early Development of Programming Languages (Knuth 和 Pardo，1977) — xÆ Encyclopedia of 
Computer Science and Technology 中 的 一 部 分 ， 这 篇 85 页 的 文章 是 一 个 优秀 作品 ， 它 详 细 叙 述 了 直到 Fortran 
语言 为 止 的 所 有 程序 设计 语言 的 发 展 历史 。 这 篇 文章 还 包括 了 一 些 程序 示例 ， 用 以 对 大 部 分 语言 中 的 特性 
HEITIR E. 

男 外 一 本 极 有 意义 的 书 是 Programming Languages: History and Fundamentals, Jean Sammet 所 著 
(Sammet，1969)。 这 本 785 页 的 著作 记载 了 从 20 世 纪 50 年 代 到 60 年 代 的 80 种 程序 设计 语言 的 各 种 细节 ，。 
Sammet 后 来 又 出 版 了 这 本 书 的 几 个 更 新 版 本 ， 其 中 的 一 个 版 本 是 Roster of Programming Languages for 
1974-75 (Sammet, 1976), 


复习 题 


1. Plankalkiil 是 哪 一 年 设计 的 ?又 是 在 哪 一 年 发 布 的 ? 

2. Plankalkiil 中 包括 了 哪 两 种 常用 的 数据 结构 ? 

3.20 世 纪 50 年 代 初 期 的 伪 代 码 是 怎样 实现 的 ? 

4. 快 速 码 的 发 明 是 为 了 克服 计算 机 硬件 在 20 世 纪 50 年 代 初期 存在 的 两 个 重大 缺点 。 这 两 个 缺点 是 什么 ? 
5. 为 什么 在 20 世 纪 50 年 代 的 初期 ， 人 们 可 以 接受 程序 解释 的 慢 速度 ? 

机 中 首先 出 现 的 什么 硬件 功能 强烈 地 影响 了 程序 设计 语言 的 发 展 ? 请 解释 为 什么 ? 
7. Fortran 语 言 的 设计 项 目 是 哪 一 年 开始 的 ? 

8. 在 Fortran 的 设计 时 期 ， 计 算 机 的 主要 应 用 领域 是 什么 ? 

9. Fortran [中 的 所 有 控制 流 语句 的 来 源 是 什么 ? 

10. 在 Fortran I 中 增加 了 哪些 最 重要 特性 ， 从 而 产生 了 Fortran II? 

11. 在 Fortran IV 中 增加 了 哪些 控制 流 语句 ， 从 而 产生 了 Fortran 77? 

12. Fortran 的 哪 种 版 本 最 先 具 有 任意 类 型 的 动态 变量 ? 

13. Fortran 的 哪 种 版 本 最 先 具 有 字符 串 处 理 ? 

14. 为 什么 20 世 纪 50 年 代 的 语言 学 家 对 人 工 智能 感 兴 趣 ? 

15.LISP 是 在 哪里 被 开发 的 ?又 是 由 谁 开 发 的 ? 
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16. Scheme COMMON LISP 在 什么 方面 是 相互 对 立 的 ? 

17. LISP 的 哪 种 方言 被 用 于 一 些 大 学 的 程序 设计 概论 课程 ? 

18. 哪 两 个 专业 组 织 一 起 设计 了 ALGOL 60? 

19. ALGOL 的 哪 一 个 版 本 中 出 现 了 块 结构 ? 

20. ALGOL 60 所 缺乏 的 哪 种 语言 元 素 ， 导 致 它 失 去 了 被 广泛 应 用 的 机 会 ? 

21. 哪 一 种 语言 是 被 设计 用 来 描述 ALGOL 60 的 语法 的 ? 

22. COBOL 是 基于 哪 种 语言 创建 的 ? 

23.COBOL 的 设计 过 程 开 始 于 哪 一 年 ? 

24. 在 COBOL 中 出 现 的 哪 一 种 数据 结构 源 于 Plankalkiil? 

25. 哪 一 个 组 织 对 COBOL 早 期 成 功 的 贡献 最 大 (就 应 用 的 广泛 程度 而 言 )? 111 
26. BASIC 第 一 个 版 本 是 以 哪 一 个 用 户 团 体 为 目标 的 ? . 
27. 为 什么 BASIC 是 20 世 纪 80 年 代 初 期 的 一 种 重要 的 程序 设计 语言 ? 

28.PL/[ 是 为 了 代替 哪 两 种 语言 而 设计 的 ? 

29. PL/I 是 为 了 哪 种 新 型 计算 机 系列 而 设计 的 ? 

30. SIMULA 67 中 的 哪些 语言 特性 现在 是 面向 对 象 程序 设计 语言 的 重要 组 成 部 分 ? 

. 哪 一 种 数据 结构 的 改革 是 由 ALGOL 68 引 入 ， 但 是 常常 被 归功 于 Pascal? 

. 哪 一 种 设计 标准 在 ALGOL 68 中 被 大 量 地 运用 ? 

33. 哪 一 种 语言 39| 入 了 case 语 句 ? 

34.C 语 言 中 的 哪些 运算 符 模 仿 了 ALGOL 68 中 的 类 似 运 算 符 ? 

.C 语 言 中 的 哪 两 种 特征 导致 了 C 没 有 Pascal 安 全 ? 

.什么 是 非 过 程 的 语言 ? 

.Prolog 数 据 库 所 具有 的 两 种 语句 是 什么 ? 

38. Ada 语 言 主要 是 为 哪 一 种 应 用 领域 而 设计 的 ? 

39. Ada 中 的 并 发 程序 单元 被 称 为 什么 ? 

40. Ada 中 的 哪 一 种 结构 提供 了 对 抽象 数据 类 型 的 支持 ? 

.是 什么 构成 了 Smalltalk 的 世界 ? 

42. 哪 三 种 概念 是 面向 对 象 程序 设计 的 基础 ? 

43. 为 什么 C++ 包括 了 C 语 言 中 已 知 的 不 安全 特性 ? 

44. Ada 语 言 和 COBOL 语 言 有 什么 共同 之 处 ? 

45. Java 的 第 一 种 应 用 是 什么 ? 

.Java 语 言 的 什么 特征 在 JavaScript 中 有 最 明显 的 表现 ? 

47.PHP 以 及 JavaScript 中 的 类 型 系统 与 Java 语 言 中 的 类 型 系统 有 什么 不 同 ? 

. 哪 一 种 数组 结构 在 C# 中 有 ， 而 在 C、C++ 或 者 Java 语 言 中 都 没有 ? 

49.C# 中 包括 了 Delphi 的 类 的 什么 特性 ? 

50.C# 所 采用 的 switch 语 句 ， 就 原来 在 C 语 言 中 的 switch 语 句 的 哪 种 缺陷 进行 了 改进 ? 
.XSLT 处 理 右 的 输入 是 什么 ? 

52. XSLT 处 理 器 的 输出 是 什么 ? 

53.JSTL 中 的 什么 元 素 是 与 子 程序 相关 联 的 ? 

54.JSP 处 理 右 将 JSP 文件 转换 成 什么 ? 

55. Servlet 程 序 在 哪里 运行 ? 112 


练习 题 


1. 如 末 当 时 Fortran 的 设计 人 员 熟 悉 Plankalkiil 的 话 ， 你 认为 Plankalkiil 中 的 哪些 语言 特性 会 对 Fortran 0 产生 
最 大 的 影响 ? 
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Backus 的 701 快 速 编码 系统 有 什么 功能 ?请 将 这 些 功能 与 当代 可 编程 手持 计算 器 的 功能 进行 比较 。 

写 出 一 小 段 关 于 Grace Hopper 和 她 的 助手 们 设计 的 A-0、A-1 和 A-2 系 统 的 历史 。 

作为 一 个 研究 项 目 ， 将 Fortran 0 语言 的 机 制 与 Laning 和 Zierler 系 统 的 机 制 进行 比较 。 

依 你 之 见 ，ALGOL 设计 委员 会 的 最 初 三 个 目标 中 的 哪 一 个 最 难 实现 ? 

对 于 LISP 程 序 中 最 常见 的 语法 错误 ， 做 出 一 个 有 根据 的 猜测 。 

LISP 开 始 是 作为 一 种 纯 函 数 式 语言 ， 但 逐渐 接受 了 越 来 越 多 的 命令 式 特性 。 为 什么 ? 

请 用 你 的 观点 详细 描述 三 条 最 重要 的 理由 ,说 明 为 什么 ALGOL 60 没 有 成 为 一 种 较为 广泛 应 用 的 语言 . 

依 你 之 见 ， 为 什么 当 Fortran 以 及 ALGOL 语 言 不 允许 长 标识 符 时 ，COBOL 语 言 却 允许 ? 

.列举 IBBM 开 发 PLM 语言 的 主要 动机 。 

.IJBM 开 及 PL/ 的 主要 动机 是 否 正 确 ? 参考 自 1964 年 以 来 计算 机 和 语言 发 展 的 历史 。 

12. 使 用 你 自己 的 语言 ， 描 述 程序 设计 语言 设计 中 的 正 交 性 概念 。 

13. 使 得 PL/I 比 ALGOL 68 的 应 用 更 为 广泛 的 主要 原因 是 什么 ? 

14. 支 持 和 反对 无 类 型 语言 的 两 种 不 同 的 论点 是 什么 ? 

15. 除 了 Prolog 语 言 之 外 ， 还 有 其 他 的 逻辑 程序 设计 语言 吗 ? 

16. 对 于 使 用 过 于 复杂 的 语言 太 危 险 这 种 论点 ， 你 的 看 法 是 什么 ? 我 们 是 否 应 该 因此 保持 所 有 的 语言 精炼 
与 简单 ? 

17. 你 认为 由 委员 会 进行 语言 设计 是 一 种 好 的 方法 吗 ? 请 给 出 理由 来 支持 你 的 观点 。 

18. 语言 在 不 断 地 演化 ， 对 于 程序 设计 语言 的 修改 ， 你 认为 应 该 给 出 什么 样 的 适当 限制 ? 请 将 你 的 答案 与 
Fortran 的 演化 过 程 进 行 比较 。 

19. 建立 一 种 表格 来 标记 所 有 主要 的 程序 设计 语言 的 发 展 ， 同 时 记载 它们 何 时 出 现 ， 首先 出 现在 哪 种 语言 
之 中 ， 以 及 语言 开发 人 员 的 身份 。 

20. 关于 微软 的 J++ 和 C# 设 计 与 升 阳 的 Java 设 计 ， 做 软 与 Sun 公 司 之 间 有 过 一 些 公开 的 交流 。 请 从 它们 各 自 
的 网 站 上 阅读 一 些 有 关 的 文献 ， 并 写 出 你 对 于 这 两 个 公司 关于 “委托 ” 之 不 同 观点 的 分 析 。 

21. 请 简略 地 给 出 一 种 标志 与 程序 设计 混合 式 语言 的 一 般 描 述 。 

程序 设计 练习 题 

1. 为 了 理解 程序 设计 语言 中 的 记录 的 作用 ， 用 C 语 言 编 写 一 个 小 程序 ， 并 使 用 数组 结构 来 存储 学 生 信息 ， 
包括 名 字 、 年 龄 、GPA (float 型 ) 和 年 级 (string 型 ， 例 如 , “freshmen” 等 )。 然 后 再 用 同样 的 语言 
但 不 使 用 结构 来 编写 这 个 程序 。 

2. 为 了 理解 程序 设计 语言 中 递归 的 作用 ， 编 写 一 个 程序 来 实现 快速 排序 。 先 使 用 递归 实现 ， 然 后 再 使 用 
韭 递归 实现 。 

3. 为 了 理解 计数 循环 的 作用 ， 使 用 计数 循环 结构 来 编写 一 个 程序 以 实现 矩阵 乘法 。 然后 仅 使 用 逻辑 循环 

来 编写 相同 功能 的 程序 ， 如 while 循 环 。 
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AIS 摘 述 语法 和 语义 


本 章 包括 下 列 内 容 。 首 先 ， 我 们 将 给 出 语法 以 及 语义 这 两 个 术语 的 定义 ;然后 详细 地 讨论 
一 种 最 第 用 的 描述 语法 的 方法 , 即 上 下 文 无 关 文 法 (也 称 巴 科斯 -诺尔 范式 , Backus-Naur Form), 
这 里 讨论 的 内 容 包 含 语言 的 派生 、 语 法 分 析 树 、 岐 义 性 、 描 述 操作 符 过 程 和 组 合 性 以 及 扩展 巴 
科斯 一 诺尔 范式 ， 然 后 讨论 用 于 描述 程序 设计 语言 的 语法 和 静态 语义 的 属性 文法 ， 最 后 介绍 描 
述 语义 的 三 种 形式 方法 /操作 语义 、 公 理 语义 和 指称 语义 。 由 于 语义 描述 方法 所 固有 的 复杂 性 ， 
所 以 我 们 只 能 进行 些 简 单 的 讨论 。 仅 仅 这 三 种 语义 描述 方法 中 的 任意 一 种 ， 就 能 很 容易 地 写成 
一 本 完整 的 书 (而 且 确 实 有 几 位 作者 已 经 这 样 做 了 )。 


3.1 概述 


为 程序 设计 语言 提供 一 种 精炼 易 懂 的 描述 是 一 项 困难 的 工作 ， 却 是 保证 语言 成 功 所 必需 的 
工作 。ALGOL 60 和 ALGOL 68 语 言 是 首先 采用 精炼 的 形式 描述 的 语言 ， 然 而 ， 由 于 这 两 种 语言 
部 分 地 采用 了 一 种 新 标记 方法 的 描述 ， 从 而 使 得 人 们 难于 理解 。 因 此 ， 这 两 种 语言 受 欢迎 的 程 
度 都 不 高 。 另 一 方面 ， 一 些 语言 具有 许多 略微 不 同 的 方言 ， 这 是 由 于 语言 定义 比较 简单 ， 且 定 
义 不 规范 也 不 严谨 。 

人 在 朱 述 一 种 语言 时 ， 目 标 是 要 使 各 种 各 样 的 人 都 能 够 理解 这 种 语言 描述 。 这 些 人 包括 最 初 
的 评估 者、 实现 者 和 产品 用 户 。 大 多 数 的 新 程序 设计 语言 在 完成 设计 之 前 ， 都 要 提交 给 潜在 的 
用 户 《〈 经 常 在 雇用 语言 设计 人 员 的 组 织 里 ) 推荐 一 段 时 期 。 这 个 反馈 周期 的 成 功 与 否 ， 在 很 大 
程度 上 取决 于 语言 描述 的 清晰 程度 。 

显然 ， 程 序 设计 语言 的 实现 人 员 一 定 要 能 够 确定 如 何 形成 语言 的 表达 式 、 语 句 和 程序 单元 ， 
以 及 它们 被 执行 时 所 预期 的 效果 。 实 现 人 员工 作 的 难度 部 分 地 取决 于 语言 描述 的 完整 程度 与 精 
确 程 度 。 

最 后 ， 语 言 的 使 用 人 员 必 须 能 够 通过 查阅 语言 参考 手册 来 确定 如 何 编写 软件 系统 。 教 科 书 
和 培训 课程 固然 能 够 帮助 学 习 语言 ， 然 而 通常 ， 语 言 手册 是 一 种 语言 唯一 的 权威 性 信息 来 源 . 

学 习 程序 设计 语言 也 像 学 习 自 然 语 言 一 样 ， 可 以 分 为 审阅 语法 与 语义 两 个 部 分 。 程 序 设计 
语言 的 语法 是 它 的 表达 式 、 语 句 及 程序 单元 的 形式 ， 而 它 的 语义 则 是 这 些 表 达 式 、 语 句 和 程序 
单元 的 含义 。 举 例 来 说 ，Java 语 言 的 while 语 句 的 语法 是 

while (< 布尔 _ 表 达 式 >) < 语句 > 

这 种 语句 形式 的 语义 是 ， 如 果 布 尔 表达 式 的 当前 值 为 真 ， 执 行 戏 入 的 语句 。 否 则 ， 执 行 
while 结 构 之 后 的 语句 。 在 这 之 后 ， 控 制 又 隐 式 地 返回 布尔 表达 式 ， 以 重复 这 个 过 程 ， 

尽管 为 了 讨论 方便 ， 常 常 将 语法 与 语义 分 开 来 ， 但 它们 实质 上 是 紧密 相关 的 。 在 一 种 设计 
民 好 的 程序 设计 语言 中 ， 语 义 应 该 直接 紧 跟 语法 ， 也 就 是 说 ， 语 句 形式 应 该 能 够 清晰 地 提示 出 
这 条 语句 所 要 完成 的 任务 。 

摘 述 语法 要 比 描述 语义 容易 ， 部 分 是 因为 已 经 存在 着 一 种 用 于 语法 描述 的 精炼 而 通用 的 标 
记 法 ， 然 而 到 目前 为 止 ， 仍 然 没有 为 语义 描述 开发 出 类 似 的 方法 。 
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3.2 描述 语法 的 普遍 问题 

无 论 是 自然 语言 《如 英语 ) 还 是 人 造 语言 (如 Java) ， 都 是 某 种 字符 集中 字符 串 的 集合 。 语 
言 的 这 种 串 就 被 称 为 句子 或 者 语句 。 一 种 语言 的 语法 规则 说 明 ， 语 言 字 符 集合 中 的 哪 种 字符 串 
是 属于 该 语言 内 的 合法 语句 。 例 如 ， 英 文 就 有 一 大 ,庞大 而 复杂 的 规则 ， 用 以 说 明 英 语句 子 的 语 
法 。 与 英文 比较 起 来 ， 即 使 是 规模 最 大 最 复杂 的 程序 设计 语言 ， 在 语法 上 也 都 极为 简单 。 

为 了 简单 起 见 ， 程 序 设计 语言 的 语法 的 形式 描述 通常 不 包括 对 于 最 低层 次 语法 单元 的 描述 。 
这 些 语法 小 单元 被 称 为 词素 〈lexeme) 。 词 素 的 描述 由 词法 说 明 给 出 ， 它 与 语言 的 语法 描述 是 分 
开 的 。 一 种 程序 设计 语言 的 词素 包括 它 的 字面 值 、 操 作 符 和 特殊 字 ， 以 及 其 他 。 我 们 也 可 以 认 
为 程序 是 一 些 词 素 的 串 ， 而 不 是 字符 的 串 。 

语素 分 成 组 ， 例 如 变量 名 、 方 法 和 类 等 。 在 程序 设计 语言 表 中 组 称 为 标识 符 (dentifier), 
每 一 组 用 一 个 名 字 或 标记 表示 。 因 此 ， 一 种 语言 的 标记 (token) 是 这 种 语言 词素 中 的 一 个 类 别 。 
例如 ， 一 个 标识 符 是 一 个 标记 ， 它 可 以 具有 词素 或 者 实例 ， 如 sum 和 total。 在 某 些 情况 下 ， 
一 个 标记 只 能 具有 唯一 词素 。 例 如 ， 算 术 操 作 符 “+” 的 标记 可 以 被 命名 为 “plus_op”， 即 
“加 法 运算 符 ”， 它 只 有 唯一 可 能 的 词素 。 考 虑 下 面 的 Java 语 句 示例 : 

index = 2 * count + 17; 


这 条 语句 的 词素 与 标记 分 别 是 : 








词 素 标 记 词 素 标 记 

index 标识 符 count 标识 符 

等 于 符号 + 加 法 运算 符 
2 整数 字面 值 17 整数 字面 值 
* 乘法 运算 符 分 号 


ee ei oS 
本 章 中 包括 的 语言 描述 的 例子 都 非常 简单 ， 而 且 大 部 分 都 包括 了 词素 描述 。 


3.2.1 语言 识别 器 


通常 ， 可 以 使 用 两 种 不 同 的 方式 来 形式 地 定义 语言 : 识别 和 生成 (尽管 这 两 个 术语 本 身 并 
不 能 给 试图 学 习 其 至 使 用 程序 设计 语言 的 人 员 提 供 一 种 具有 实际 意义 的 定义 )。 假 设 我 们 有 一 种 
语言 L， 这 种 语言 使 用 字母 字符 集 。 为 了 使 用 识别 的 方法 来 形式 地 定义 语言 L， 我 们 需要 构造 
一 个 称 为 识别 装置 的 机 制 ，R。 这 种 识别 装置 能 够 读 入 字母 集中 的 字符 串 。 需 要 将 R 设 计 成 为 
可 以 指示 给 定 的 输入 字符 串 是 否 来 自 语言 L。 在 实际 效果 上 ，R 或 者 是 接受 ， 或 者 是 拒绝 这 一 条 
给 定 的 字符 串 。 这 样 的 装置 就 如 同 过 滤器 一 样 ， 将 正确 与 错误 的 句子 区 分 开 来 。 如 果 向 R 输 入 
集合 二 中 的 任意 字符 串 ，R 仅 接受 那些 属于 L 中 的 字符 串 ， 那 么 R 就 是 L 的 描述 。 出 于 实用 的 目 
的 ， 大 多 数 有 用 的 语言 是 无 限 的 ， 似 乎 这 种 识别 过 程 会 是 宛 长 而 低 效 的 。 然 而 在 实际 上 ， 并 不 
会 使 用 识别 装置 来 枚 举 语言 中 的 所 有 句子 。 

饥 译 器 中 的 语法 分 析 部 分 对 于 编译 器 所 翻译 的 语言 而 言 就 是 一 个 识别 器 。 在 充当 这 个 角色 
时 ， 识 别 器 并 不 需要 测试 所 有 可 能 的 字符 串 ， 以 决定 每 一 个 串 是 否 属于 该 语言 。 相 反 ， 它 只 需 
要 决定 所 给 的 程序 是 否 在 语言 之 中 。 实 际 上 ， 语 法 分 析 程序 所 要 决定 的 ， 是 给 定 的 程序 在 语法 
上 正确 与 否 。 关 于 语法 分 析 程 序 (也 称 为 语法 分 析 器 ) 将 在 第 4 章 中 讨论 。 


3.2.2 语言 生成 器 
语言 生成 器 是 能 用 来 产生 语言 中 句子 的 一 种 装置 。 我 们 可 以 想象 ， 这 个 生成 器 装 有 一 个 按 


钮 ， 每 按 一 下 ， 就 产生 一 个 语言 句子 。 在 按 生成 器 的 按钮 时 ， 会 产生 哪个 特定 句子 并 不 可 以 预 
知 ， 因 而 生成 器 似乎 只 是 一 种 用 途 有 限 的 装置 ， 就 像 语言 的 描述 器 一 样 。 然 而 较 之 识别 器 ， 人 
们 还 是 更 喜欢 某 些 形式 的 生成 器 ， 因 为 它们 更 容易 被 人 们 阅读 和 理解 。 相 比 之 下 ， 编 译 器 的 语 
法 检测 部 分 (一 种 语言 识别 器 ) 对 程序 人 员 而 言 就 不 是 一 种 有 用 的 语言 描述 ， 因 为 它 只 能 被 用 
于 试探 性 模式 (trial-and-error mode )。 例 如 ， 使 用 一 个 编译 器 来 确定 某 一 特定 语句 语法 的 正确 
性 时 ， 程序 人 员 只 能 输入 一 个 试探 性 版 本 ， 以 检测 它 能 否 被 编译 器 所 接受 。 而 在 使 用 生成 器 时 ， 
人 们 则 通 第 可 以 通过 将 某 一 特定 语句 与 生成 器 中 的 结构 进行 比较 ， 就 可 以 确定 这 条 语句 的 语法 
是 否 正确 。 

同一 种 语言 的 形式 生成 器 和 识别 装置 有 着 紧密 的 联系 。 这 是 计算 机 科学 中 的 基本 发 现 之 一 ， 
正 是 这 项 发 现 ， 产 生 了 许多 现在 称 为 形式 语言 以 及 编译 器 设计 的 理论 。 我 们 将 在 下 一 节 再 返回 
来 讨论 生成 器 与 识别 器 的 关系 。 


3.3 描述 语法 的 形式 方法 


本 市 将 讨论 形式 语言 的 产生 机 制 。 这 种 通常 被 称 为 文法 的 机 制 ， 是 用 来 描述 程序 设计 语言 
的 语法 的 。 


3.3.1 巴 科斯 -诺尔 范式 及 上 下 文 无 关 文法 


从 20 世 纪 50 年 代 中 期 至 后 期 ，John Backus 和 Noam Chomsky 分 别 于 独立 研究 工作 中 发 明了 
相同 的 标记 法 。 这 种 标记 法 从 此 成 为 最 广泛 应 用 的 程序 设计 语言 语法 描述 的 形式 方法 。 

3.3.1.1 上 下 文 无 关 文 法 

在 20 世 纪 50 年 代 中 期 ， 著 名 语言 学 家 Chomsky 描 述 了 用 来 定义 四 个 类 型 的 语言 的 四 种 生成 
装置 或 文法 (Chomsky, 1956, 1959) 。 其 中 的 两 类 文法 成 为 描述 程序 设计 语言 语法 的 有 用 工具 ， 
分 别 为 上 下 文 无 关 文法 和 正则 文法 。 正 则 文法 描述 程序 设计 语言 的 标记 (token) 的 形式 。 而 除 
了 极 个 别 部 分 ， 上 下 文 无 关 文法 则 可 以 描述 整个 程序 设计 语言 的 语法 。 因 为 Chomsky 是 一 位 语 
言 学 家 ， 所 以 他 主要 感 兴 趣 的 是 自然 语言 的 理论 性 质 。 当 时 他 对 用 于 与 计算 机 交流 的 人 造 语言 
没有 兴趣 。 因 而 一 直到 后 来 ， 他 的 工作 才 被 应 用 于 程序 设计 语言 。 

3.3.1.2 巴 科斯 ~- 诺尔 范式 的 起 源 

在 Chomsky 的 语言 文法 之 后 不 入， 美国 计算 机 协会 和 应 用 数学 与 力学 协会 (ACM-GAMM) 
开始 设计 ALGOL 58 语 言 。ACM-GAMM 协 会 中 的 一 位 重要 成 员 John Backus, 在 1959 年 的 一 个 
国际 会 议 上 发 表 了 一 篇 描述 ALGOL 58 的 论文 ， 这 篇 论文 具有 里 程 碑 式 的 意义 (Backus, 1959), 
在 其 中 ，Backus 介 绍 了 一 种 用 来 说 明 程 序 设 计 语 言语 法 的 新 的 形式 标记 法 。 后 来 ，Peter Naur 又 
对 这 种 新 的 标记 法 进行 了 少量 的 修改 ， 用 以 描述 ALGOL 60 语 言 (Naur, 1960) 。 修 改过 的 语法 
摘 述 方法 就 成 为 闻名 的 巴 科斯 -诺尔 范式 (Backus-Naur Form ) ， 或 者 简称 为 BNE。 

BNF 是 一 种 非常 自然 的 语法 描述 标记 法 。 事 实 上 ， 一 种 与 BNF 相 类 似 的 标记 法 曾经 在 公元 
前 几 百 年 就 被 帕 尼 尼 (Panini) 用 来 描述 楚 语 (Sanskrit) 语法 (Ingerman, 1967), 

尽管 当时 计算 机 的 使 用 人 员 对 于 在 ALGOL 60 语 言 报 告 中 使 用 BNF 还 不 能 够 接受 ， 但 是 
BNF 很 快 就 成 为 (而 且 至 今 仍然 是 ) 精炼 描述 程序 设计 语言 语法 的 最 普遍 方法 。 

十 分 惊人 的 是 ，BNF 与 Chomsky 的 上 下 文 无 关 语 言 的 生成 机 制 ( 称 为 上 下 文 无 关 文 法 ) IL 
乎 完全 相同 。 在 本 章 的 余下 部 分 ， 我 们 将 简单 地 称 上 下 文 无 关 文 法 为 文法 。 此 外 ,术语 “BNE” 
和 “文法 ”将 交替 使 用 。 
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3.3.13 ”基本 原理 

元 语言 是 一 种 用 来 描述 另外 一 种 语言 的 语言 。 而 BNF 就 是 程序 设计 语言 的 一 种 元 语言 。 

BNF 使 用 抽象 语法 结构 。 例 如 ， 可 以 将 一 条 简单 的 Java 赋 值 语句 抽象 地 表示 为 < 赋值 语句 >。 
(通常 使 用 尖 括 号 来 限定 抽象 名 称 。) < 赋值 语句 > 的 实际 定义 可 以 为 

< 赋值 语句 > 一 < 变量 > = < 表达 式 > 

前 头 左边 的 符号 称 为 “左手 边 ”(left-hand side, LHS ) ， 它 是 正在 定义 的 抽象 。 稍 头 右边 的 
内 容 是 LHS 的 定义 ， 它 被 称 为 “右手 边 ” (right-hand side, RHS)。RHS 部 分 由 标记 、 词素 以 及 指 
加 其 他 抽象 的 引用 所 组 成 。( 实 际 上 ， 标 记 也 是 抽象 .) 全 部 加 在 一 起 ， 这 一 条 定义 被 称 为 一 个 
规则 ， 或 者 称 为 一 个 产生 式 。 在 刚刚 给 出 的 规则 示例 中 ， 显 然 要 在 < 赋值 语句 > 定义 具有 意义 之 
前 ， 先 定义 抽象 < 变量 > 与 < 表达 式 >。 

这 一 条 特定 规则 说 明 ， 抽 象 < 赋值 语句 > 被 定义 成 为 抽象 < 变量 > 的 一 个 实例 ， 后 面 跟随 着 词 
素 =， 再 后 面 接着 抽象 < 表达 式 > 的 一 个 实例 。 下 面 是 一 个 句子 示例 ， 这 条 句子 的 语法 结构 由 上 
面 的 规则 描述 : 


total = subtotall + subtotal2 


在 BNF 的 描述 或 文法 中 ， 抽 象 通常 被 称 为 非 终结 符 (nonterminal symbol), ， 或 简称 为 非 终结 
(nonterminal) ， 而 规则 中 的 词素 和 标记 则 被 称 为 终结 符 (terminal symbol), 或 者 简称 为 终结 
(terminal) 。 一 个 BNF 描 述 ， 或 一 种 文法 ， 仅 仅 是 一 个 规则 的 集合 。 

非 终结 符 可 以 具有 两 个 或 多 个 不 同 的 定义 ， 用 以 表示 语言 中 的 两 种 或 多 种 可 能 的 语法 形式 。 
可 以 将 多 重 定义 写成 一 条 规则 ， 使 用 符号 “|” 将 不 同 的 定义 分 别 开 来 。 符 号 “|” 的 意义 为 逻辑 
或 (OR)。 例 如 ， 可 以 使 用 两 条 规则 来 描述 Ada 语 言 中 的 if 语 句 ， 

<if_ 语 句 > 一 if < 逻辑 表达 式 > then < 语句 > 

<if_ 语句 > 一 if < 逻辑 表达 式 > then < 语句 > else < 语句 > 

或 者 ， 仅 仅 使 用 一 条 规则 

<if_ 语 句 > 一 if < 逻辑 表达 式 > then < 语句 > 

| if < 逻辑 表达 式 > then < 语句 > else < 语句 > 

BNF 尽 管 侧 单 ， 但 它 具 有 充分 的 表达 能 力 来 描述 几乎 所 有 的 程序 设计 语言 的 语法 ， TRE, 
CREM MRAR, BERRE, ERRE, 甚至 隐 含 操作 符 优 
先 级 以 及 操作 符 结合 性 。 

3.3.1.4 表 描 述 

数学 中 使 用 省 略 符号 (…) 来 书写 长 度 可 变 的 表 ，1, 2, …， 就 是 一 个 例子 。BNF 中 没有 包 
后 省 略 符号 ， 因 而 需要 使 用 其 他 的 替代 方法 来 描述 程序 设计 语言 中 语法 元 素 的 表 (例如 ， 出 现 
在 数据 声明 语句 里 的 标识 符 表 )。 最 常用 的 替代 方法 是 递归 。 如 采 一 条 规则 的 LHS 出 现在 它 的 
RHS 之 中 ， 我 们 称 这 条 规则 是 递归 的 。 下 面 这 条 规则 用 以 说 明 如 何 运 用 递归 进行 表 的 描述 ， 

< 标识 符 _ 表 > 一 标识 符 

| 标识 符 ，< 标 识 符 _ 表 > 

这 条 规则 定义 < 标识 符 _ 表 > 为 单个 标记 (标识 符 ) 或 者 标识 符 ， 然 后 紧 跟 逗号 ， 后 面 再 跟 
万 一 个 < 标识 符 _ 表 > 的 实例 。 在 本 章 的 余下 部 分 还 会 下 许多 文法 例子 里 运用 递归 进行 表 的 描述 。 

3.3.1.5 文法 与 派生 

文法 征 定 义 语 言 的 生成 装置 。 语 言 的 句子 通过 应 用 一 系列 语法 规则 生成 ， 这 个 过 程 起 始 于 
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文法 中 的 一 个 特殊 的 非 终结 符 ， 称 为 起 始 符 (start symbol) 。 句 子 的 生成 则 被 称 为 派生 。 在 一 个 
完整 语言 的 文法 中 ， 起 始 符 代 表 了 一 个 完整 的 程序 ， 通 常 被 命名 为 < 程序 >。 我 们 用 例 3.1 显 示 的 
简单 文法 来 说 明 派 生 。 
例 3.1 一 个 简单 语言 的 文法 
< 程序 > 一 begin < 语句 表 > end 
< 语句 _ 表 > 一 < 语句 > 
| < 语句 >; < 语句 表 > 
< 语句 > 一 < 变量 > = < 表达 式 > 
< 变量 > 一 A|B|C 
< 表达 式 > 一 < 变量 > + < 变量 > 
| < 变量 > - < 变量 > 
| < 变量 > 
例 3.1 中 的 语言 只 具有 一 种 语句 形式 ， 即 赋值 语句 。 它 的 程序 包括 特殊 字 begin， 后 面 跟随 
一 列 由 分 号 隔 开 的 语句 ， 再 接着 特殊 字 end。 它 的 表达 式 为 单个 变量 ， 或 者 是 被 “+” 或 “-， 
操作 符 分 开 的 两 个 变量 。 这 个 语言 中 的 变量 名 只 有 &R，B 和 C。 
下 面 古 这 个 语言 的 一 个 派生 程序 : 
< 程序 > 


V 


begin < 语句 表 > end 

begin < 语句 >; < 语句 _ 表 > end 

> begin < 变量 > = < 表达 式 >; < 语句 表 > end 
begin A = < 表达 式 >; < 语句 表 > end 


| 有 
V 


V 


> begin A = < 变量 > + < 变量 >; < 语句 K> end 
=> begin A = B + < 变量 >; < 话 句 K> end 

=> begin A = B + C; < 语句 K> end 

=> begin A = B + C; < 语句 > end 

=> begin A = B + C; < 变量 > = < 表达 式 > end 
=> begin A = B + C; B = < 表达 式 > end 

=> begin A = B + C; B = < 变量 > end 

=> begin A = B + C; B = C end 


在 这 个 < 程序 > 例子 里 ， 这 个 派生 也 同 程序 的 所 有 派生 一 样 ， 始 于 起 始 符 。 符 号 “=>” 读 为 
派生 。 每 一 个 后 续 的 串 都 派生 自 它 前 面 的 串 ， 通 过 使 用 非 终结 符 的 一 个 定义 值 来 代替 前 面 串 中 
的 非 终结 符 ， 从 而 完成 了 这 种 派生 。 派 生 进 程 中 的 每 一 个 串 ， 包 括 < 程序 >， 都 被 称 为 句子 范式 。 

在 上 面 的 派生 进程 中 ， 被 替换 的 非 终结 符 总 是 前 面 句子 范式 中 最 左面 的 那个 非 终 结 符 。 使 
用 以 上 顺序 进行 替换 的 派生 被 称 为 最 左派 生 。 派 生 将 一 直 持 续 到 在 句子 范式 里 再 没有 非 终 结 符 
为 止 。 最 后 的 句子 范式 中 仅仅 包含 了 终结 符 或 者 词素 ， 这 就 是 被 生成 的 句子 。 

除了 最 左派 生 以 外 ， 也 可 以 有 最 右派 生 ， 或 者 既 非 最 左 又 非 最 右 的 派生 。 派 生 的 顺序 对 于 
由 一 种 文法 生成 的 语言 并 没有 影响 。 
| 通过 选择 规则 中 不 同 的 RHS 部 分 ， 并 以 此 来 替换 派生 中 的 非 终结 符 ， 能 够 生成 语言 中 不 同 
的 句子 。 穷 尽 所 有 选择 的 组 合 ， 就 能 够 产生 完整 的 语言 。 像 大 多 数 其 他 语言 一 样 ， 这 样 的 语言 
息 无 限 的， 因此 不 能 够 期 望 在 有 限 的 时 间 内 生成 语言 中 的 所 有 句子 。 

例 3.2 是 另 一 种 类 型 的 例子 ， 它 给 出 了 典型 程序 设计 语言 的 一 部 分 文法 。 

例 3.2 中 的 文法 描述 了 几 种 赋值 语句 ， 这 些 语句 的 右边 是 具有 乘法 和 加 法 操作 符 以 及 括号 的 
算术 表达 式 。 例 如 ， 语 名 


A=B* (A +C) 





例 3.2 简单 赋值 语句 的 文法 


< 赋值 语句 > 一 < 标识 符 > = < 表达 式 > 
< 标识 符 > 一 A | B | <c 
< 表达 式 > 一 < 标识 符 > + < 表达 式 > 

| < 标识 符 > * < 表达 式 > 








| ( < 表达 式 > ) 
| < 标识 符 > 
是 由 最 左派 生生 成 的 : < 赋值 语句 > 
< 赋值 语句 > = > < 标识 符 > = < 表达 式 > 
= > A = < 表达 式 > < 标识 符 > = ”< 表达 式 > 
= > A = < 标识 符 > * < 表达 式 > 
he a ee A < 标识 符 > ”* ”< 表达 式 > 
=> A = B-* ( < 表达 式 > ) 
= > A = B * ( < 标识 符 > + < 表达 式 > ) 
=>A=B* ( A + < 表达 式 > ) < 表达 式 > ) 
=>A=B* (A + < 标识 符 > ) 
=>A=B*(A+C) < 标识 符 > + ”< 表达 式 > 


3.3.1.6 语法 分 析 树 | T 

最 吸引 人 的 一 种 语法 特征 ， 是 在 这 种 语法 中 定义 A 
的 对 语言 句子 层次 语法 结构 的 自然 描述 。 这 种 层次 结 
构 就 被 称 为 语法 分 析 树 。 例 如 ， 图 3-1 中 的 语法 分 析 树 
显示 了 在 前 面 派生 的 赋值 语句 的 结构 。 

语法 分 析 树 的 每 一 个 内 部 节点 都 由 一 个 非 终 结 符 
来 标记 ， 而 它 的 每 一 个 叶 节 点 都 由 一 个 终结 符 来 标记 。 语 法 分 析 树 的 每 一 棵 子 树 都 描述 语句 中 
抽象 的 一 个 实例 。 

3.3.1.7 歧义 性 

如 果 由 一 条 文法 生成 的 句子 具有 两 种 或 者 多 种 不 同 的 语法 分 析 树 ， 就 称 这 条 文法 是 歧义 的 。 
考虑 例 3.3 中 显示 的 文法 ， 它 是 例 3.2 中 文法 的 一 个 变 体 。 


例 3.3 简单 赋值 语句 的 一 条 歧义 性 文法 

< 赋值 语句 > 一 < 标识 符 > = < 表达 式 > 
< 标识 符 > 一 A | B | C 
< 表达 式 > 一 < 表达 式 > + < 表达 式 > 

| < 表达 式 > * < 表达 式 > 

| ( <#idst> ) 

| < 标识 符 > 
例 3.3 中 的 文法 是 上 收 义 的 ， 因 为 句子 


A ='B + Gt* -A 


具有 如 图 3-2 所 示 的 两 棵 不 同 的 语法 分 析 树 。 这 说 明 在 语法 结构 上 ， 例 3.3 中 的 文法 比例 3.2 
中 的 文法 稍 欠 严谨 ， 导 致 了 皮 义 性 。 例 3.3 中 的 文法 不 是 仅仅 允许 表达 式 的 语法 分 析 树 从 右边 生 
长 ， 而 是 允许 它 既 从 左边 又 从 右边 生长 。 

语言 结构 上 的 语法 歧义 性 是 一 个 问题 ， 因 为 编译 器 通常 将 语法 形式 作为 这 些 结构 的 语义 的 
基础 。 尤 其 是 ， 编 译 右 是 按照 语句 的 语法 分 析 树 来 决定 应 该 为 这 条 语句 产生 什么 样 的 代码 。 如 





C 
图 3-1. 简单 语句 A = B* (A+C ) 的 
一 棵 语法 分 析 树 
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末 一 种 语言 结构 具有 多 个 语法 分 析 树 ， 那 么 就 不 能 够 唯一 地 确定 这 种 结构 的 语义 。 关 于 这 个 问 
题 ， 将 在 下 面 小 节 的 两 个 特别 的 例子 中 进行 讨论 。 

有 时 ， 语 法 有 一 些 其 他 特征 来 决定 其 是 否 是 岐 义 的 ，9 这 很 有 用 。 这 些 特 征 包括 : 1) 是 否 
语法 产生 一 个 句子 并 带 有 超过 一 个 最 左派 生 ，2) 是 否 语法 产生 一 个 句子 并 带 有 超过 一 个 最 右 
派生 。 

一 些 语法 分 析 的 算法 可 以 基于 歧义 的 文法 。 当 这 样 一 个 语法 分 析 器 遇 到 一 种 歧义 的 结构 时 ， 
它 将 使 用 设计 人 员 所 提供 的 非 文法 信息 来 构造 正确 的 语法 分 析 树 。 在 许多 情形 下 ， 层 义 语法 能 
重 写 成 非 岐 义 的 ， 但 是 仍 会 产生 需要 的 语言 。 


< 赋值 语句 > < 赋值 语句 > 
< 标识 符 > = ”< 表达 式 > < 标识 符 > = ”< 表达 式 > 
A < 表达 式 > + ”< 表达 式 > A < 表达 式 > * ”< 表达 式 > 


< 标识 符 > < 表达 式 > * ”< 表达 式 > < 表达 式 > + ”< 表达 式 > < 标识 符 > 


| 


B ”< 标识 符 > < 标识 符 > < 标识 符 > < 标识 符 > a 


| | 


图 3-2 同一 条 语句 A = B+ C * A 的 两 棵 不 同 的 分 析 树 


3.3.1.8 操作 符 优 先 级 

当 一 个 表达 式 包 含 两 个 不 同 的 操作 符 时 ， 例 如 ，x+y*z， 一 个 明显 的 语义 问题 是 两 个 操作 
符 的 评估 顺序 〈 是 加 后 乘 ， 还 是 乘 后 再 加 ) 。 这 个 语义 问题 能 通过 赋予 操作 符 不 同 的 优先 级 来 解 
决 。 例 如 ， 如 * 能 被 赋予 比 + 更 高 的 优先 级 (由 语言 设计 人 员 来 实现 )， 那么 将 先 做 乘法 ， 而 不 
管 在 表达 式 中 两 个 操作 符 出 现 的 顺序 。 

如 前 所 述 ， 文 法 能 够 描述 一 定 的 语法 结构 ， 因而 通过 这 种 结构 的 语法 分 析 树 可 以 确定 语法 
结构 的 部 分 语义 。 特 别 地 ， 如 果 一 个 算术 表达 式 中 的 操作 符 生成 于 分 析 树 的 较 低 层 上 (因此 该 
操作 符 必须 先 被 求 值 )， 这 就 表明 ， 它 比 在 分 析 树 的 较 高 层 上 生成 的 操作 符 有 优先 级 。 例如 ， 
3.2 中 的 第 一 棵 语法 分 析 树 中 的 乘法 操作 符 产 生 于 分 析 树 的 较 低层 ， 这 表示 它 比 表达 式 中 的 加 法 
操作 符 具 有 优先 级 ， 然 而 在 第 二 棵 语法 分 析 树 上 却 恰恰 相反 。 显 而 易 见 ， 这 两 棵 分 析 树 所 给 出 
的 关于 优先 级 的 信息 正好 相互 矛盾 。 

请 注意 ， 尽 管 例 3.2 中 的 文法 不 是 歧义 的 ， 但 是 这 个 例子 中 的 操作 符 优先 级 却 不 是 通常 所 应 
有 的 顺序 。 在 这 个 文法 中 ， 一 棵 具有 多 操作 符 句 子 的 语法 分 析 树 ， 无 论 涉 及 了 哪些 操作 符 ， 表 
达 式 中 最 右边 的 操作 符 总 是 占据 语法 分 析 树 上 最 低 的 位 置 ， 而 其 他 操作 符 随 着 它 在 表达 式 中 位 
置 的 从 右 到 左 ， 它 在 语法 分 析 树 上 的 位 置 也 逐渐 移 往 高 处 。 例 如 ， 在 表达 式 A+B*C 中 ，* 在 树 
中 最 低 的 位 置 ， 表 明 最 先 处 理 它 。 然 而 ， 在 表达 式 A*B+C 中 ， + 在 树 中 最 低 的 位 置 ， 表 明 最 先 
处 理 + 运 算 。 

无 论 这 些 操 作 符 在 表达 式 中 出 现 的 次 序 如 何 ， 这 里 正在 讨论 的 简单 表达 式 的 文法 都 能 够 写 
成 非 层 义 的 ， 也 能 够 对 + 和 * 操 作 符 指定 一 种 前 后 一 致 的 优先 级 。 从 要 对 具有 不 同 优先 级 的 操作 
符 的 操作 数 使 用 分 开 的 非 终 结 符 ， 就 能 指定 正确 的 顺序 。 这 需要 额外 的 非 终 结 符 和 一 些 新 规则 ， 


O 注意， 数学 上 不 可 能 判 言 任意 语法 (arbitrary grammar) Aik VAY, 
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相对 在 + 和 * 操 作 符 又 对 操作 数 使 用 < 表达 式 >， 我 们 可 以 使 用 3 个 非 终 结 符 来 表示 操作 数 ， 它 们 
能 允许 文法 强制 不 同 的 操作 符 对 应 语义 树 的 不 同 层 次 。 如 果 < 表 达 式 > 是 表达 式 的 根 符号 ， 通 过 
让 < 表达 式 > 只 直接 产生 + 操作 符 使 用 新 的 非 终结 符 < 项 > 作为 + 的 右 操作 数 ， 强 制 使 + 位 于 语义 树 
的 顶端 。 接 着 ， 使 用 < 项 > 作为 左 操作 数 和 新 的 非 终结 符 < 因子 > 作为 右 操 作 数 ， 来 定义 < 项 > 产生 
* 操 作 符 。 现 在 ，* 总 是 位 于 语义 树 的 低层 中 ， 简 单 地 因为 在 每 次 派生 中 它 比 + 更 远离 开始 符 。 
例 3.4 中 的 文法 就 是 这 样 一 种 文法 。 
例 3.4 表达 式 的 非 野 义 性 文法 
< 赋值 语句 > 一 < 标识 符 > = < 表达 式 > 
< 标识 符 > 一 A | B | c 
< 表达 式 > 一 < 表达 式 > + < 项 > 
| < 项 > 
< 项 > 一 < 项 > * < 因子 > 
| < 因子 > 
< 因子 > 一 ( < 表达 式 > ) 
| < 标识 符 > 


例 3.4 中 的 文法 与 例 3.2 和 例 3.3 中 的 文法 都 产生 同一 种 语言 ， 但 不 同 的 是 ， 这 条 文法 是 非 岐 
义 的 ， 而 且 指 定 了 通常 的 乘法 与 加 法 操作 符 的 优先 级 顺序 。 下 面 运用 例 3.4 中 的 文法 派生 句子 A 
= B+C * A: 

















< 赋值 语句 > 

< 赋值 语句 > = > < 标识 符 > = < 表达 式 > 

= > A = < 表达 式 > 

= > A = < 表达 式 > + < 项 > < 标识 符 > < 表达 式 > 

= > A = < 项 > + < 项 > 

= > A = < 因子 > + < 项 > A ”< 表达 式 > + < 项 > 

= > A = < 标识 符 > + < 项 > | se es 

=> A=B + < 项 > 

=>A = B+ < 项 > * < 因子 > < 项 > < 项 > < 因子 > 

= > A = B + < 因子 > * < 因子 > | | 

=>A=B + < 标识 符 > * < 因子 > < 因子 > ”< 因子 > < 标识 符 > 

=>A=B+C * < 因子 > 

=>A=B + C * .< 标识 符 > , 

ee Se < 标识 符 > < 标识 符 > A 
图 3-3 显 示 了 运用 例 3.4 中 的 文法 生成 这 一 条 名 

B C 


子 的 唯一 语法 分 析 树 。 

语法 分 析 树 与 派生 之 间 的 联系 非常 紧密 : 很 容 “图 3-3 语句 A = B + C * A 运用 非 歧 义 文法 
易 从 它们 两 者 中 的 任意 一 个 构造 出 另外 的 一 个 。 非 的 唯一 语法 分 析 树 
歧义 的 文法 的 每 一 个 派生 只 有 唯一 的 语法 分 析 树 ， 尽 管 这 棵 树 能 够 被 不 同 的 派生 所 表示 。 例 如 ， 
句子 A = B+ C * A 在 如 下 所 示 的 派生 就 不 同 于 在 前 面 给 出 的 同一 条 语句 的 派生 。 这 里 是 一 个 
最 右派 生 ， 而 在 前 面 给 出 的 是 最 左派 生 。 然 而 这 两 种 派生 都 由 同一 棵 语法 分 析 树 来 表示 。 

< 赋值 语句 > = > < 标识 符 > = < 表达 式 > 


= > < 标识 符 > = < 表达 式 > + < 项 > 
= > < 标识 符 > = < 表达 式 > + < 项 > * < 因子 > 
= > < 标识 符 > = < 表达 式 > + < 项 > * < 标识 符 > 
= > < 标识 符 > = < 表达 式 > + < 项 > * A 

= > < 标识 符 > = < 表达 式 > + < 因子 > * A 


4 it FF i Fo EX 87 


= > < 标识 符 > = < 表达 式 > + < 标识 符 > * A 

= > < 标识 符 > = < 表达 式 > + C * 入 

= > < 标识 符 > = < 项 > + cra 

= > < 标识 符 > = < 因子 > + cra 

= > < 标识 符 > = < 标识 符 > + C * A < 赋值 语句 > 

= > < 标识 符 > = B+CrA 

= 

< 标识 符 > “= ”< 表达 式 > 

3.3.1.9 操作 符 的 结合 
当 一 个 表达 式 包 括 同一 优先 级 的 两 个 操作 符 (如 * 和 /)， A ”< 表达 式 > ”+ < 项 > 


例如 A/B*C 时 ， 需 要 一 个 语义 规则 来 指 是 优先 级 。9S 这 个 规 | 
则 叫 结合 性 (associativity) 。 正 如 优先 级 的 例子 ， 表 达 式 的 dh + ”< mys 
文法 可 能 恰当 地 隐 含 了 操作 符 的 结合 性 。 考 虑 下 面 的 一 个 赋 | a | 
值 语句 的 例子 : < 项 > < 因子 > < 标识 符 > 


A=B+CH+A | | | 


图 3-4 显 示 了 由 例 3.4 中 的 文法 所 定义 的 这 条 句子 的 语法 <B> e à 
分 析 树 。 


图 3-4 中 的 这 棵 语法 分 析 树 显示 出 左边 的 加 法 操作 符 比 右 
边 的 加 法 操作 符 层次 低 。 对 于 必须 左 结合 的 加 法 ， 这 是 正确 
的 顺序 ， 左 结合 加 法 是 典型 的 。 但 在 大 多 数 计算 机 的 情形 中 ， 3-4 HA = B+ Cc + anys 
加 法 的 结合 性 是 任意 的 。 在 数学 中 的 加 法 是 结合 的 ， 这 意味 法 分 析 树 ， 介 绍 加 法 结合 性 
者 左 结合 与 右 结 合 的 运算 顺序 等 价 , 即 (A + B) + C =A 


现在 大 数值 数 的 第 8 位 数 上 。 然 而 ， 如 果 先 将 10 个 小 数值 的 数 加 在 一 起 ， 然 后 再 将 这 个 结果 加 入 
大 数值 的 数 ， 这 个 需要 保存 七 位 数字 精确 度 的 数值 结果 就 成 了 1.00 000 1 x 107, 至 于 减法 与 除 
法 ， 则 无 论 在 数学 中 还 是 在 计算 机 方面 都 不 是 结合 的 。 所 以 ， 正确 的 结合 性 对 于 包含 减法 或 除 
当 有 一 条 文法 规则 ， 它 的 LHS 也 出 现在 它 的 RHS 的 起 始 位 置 ， 这 条 规则 就 被 称 为 左 递归 的 。 
左 递归 说 明 左 结合 性 。 例 如 ， 例 34 中 的 文法 规则 的 左 递归 导致 了 加 法 与 乘法 这 两 种 操作 都 为 左 
结合 的 。 不 幸 的 是 ， 左 递归 不 允许 使 用 一 些 重要 的 语法 分 析 算 法 。 当 使 用 这 样 的 算法 时 ， 必 须 
修改 文法 以 删除 左 递归 。 而 且 ， 这 不 允许 文法 精确 指定 确定 的 操作 是 左 结合 的 . IBA, £ 
结合 性 能 够 由 编译 程序 指定 ， 尽 管 文法 中 没有 指定 。 
在 大 多 数 提供 乘 需 运算 的 语言 之 中 ， 乘 需 操 作 符 是 右 结合 的 。 可 以 使 用 右 递归 来 说 明 右 结 
合 。 如 果 一 条 文法 规则 的 LHS 出 现在 RHS 的 最 右 端 ， 则 该 条 文法 规则 是 右 递归 的 ， 例如 ， 规 则 
< 因子 > 一 < 第 > * * < 因子 > 
| <> 
<w> 证 < 表 达 式 > ) 
| < 标识 符 > 


可 以 被 用 来 描述 右 结合 的 操作 符 的 乘 寡 。 


O 在 一 个 表达 式 中 重复 出 现 同一 个 操作 符 会 有 相同 的 问题 ， 例 如 ，A/B/C、 
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3.3.1.10 if-then-else 的 非 歧 义 性 文法 

在 3.3.1.3 节 里 ， 曾 给 出 一 种 关于 特殊 形式 的 1f-then-else 语 句 的 BNF 规 则 ， 这 里 再 次 给 
出 如 下 : 

<if 语句 > 一 if < 逻辑 表达 式 > then < 语句 > 

| if < 逻辑 表达 式 > then < 语句 > else < 语句 > 

如 果 我 们 也 有 < 语句 > 一 < 站 语句 >， 那 么 这 条 文法 就 是 歧义 的 。 能 够 最 简单 地 说 明 这 种 歧义 
性 的 一 个 句 型 为 : 

if < 逻辑 _ 表 达 式 > then if < 逻辑 表达 式 > then < 语句 > else < 语句 > 

图 3-5 中 的 两 棵 语法 分 析 树 显示 了 这 个 句 型 的 歧义 性 。 考 虑 这 个 构造 的 下 面 的 例子 : 

if (done == true) 
0) 


then if (denom == 
then quotient = 0; 


else quotient num / denom; 


问题 是 ， 在 图 3-5 中 上 面 的 语义 树 用 作 翻 译 的 主要 部 分 ， 当 done 不 为 真 时 ，else 子 句 将 执 
行 ， 但 这 可 能 不 是 构造 作者 的 原本 意图 。 我 们 将 在 第 8 章 里 研究 与 这 种 else 结 合 性 问题 有 关 的 
一 些 实际 问题 。 


<if 语句 > 


if < 逻辑 表达 式 > then < 语句 > else < 语句 > 


<if 语句 > 


if < 逻辑 表达 式 > then < 语句 > 


<if 语句 > 


if < 逻辑 表达 式 > then < 语句 > 


<if 语句 > 


if < 逻辑 表达 式 >then < 语句 > else < 语句 > 
图 3-5 同一 句 型 的 两 棵 不 同 的 语法 分 析 树 


我 们 现在 将 开发 描述 这 种 让 语句 的 一 种 非 歧 义 性 文法 。 大 多 数 语言 关于 if 结构 的 规则 是 ， 
当 有 else 子 句 出 现时 ，else 与 前 面 最 接近 的 没有 被 匹配 的 then 相 匹配 。 因 此 ， 在 一 个 then 
以 及 与 之 匹配 的 else 之 间 ， 不 能 有 一 个 没有 else 的 if 语 句 。 因 而 针对 这 种 情形 ， 就 必须 区 别 
已 经 被 匹配 了 的 语句 和 没有 被 匹配 的 语句 ， 这 里 没有 被 匹配 的 语句 只 能 是 else 的 数目 少 于 if 
的 数目 ， 而 所 有 其 他 语句 都 已 经 被 匹配 好 了 。 在 上 述 文 法 中 存在 的 问题 是 ， 它 以 等 同 的 语法 重 
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要 性 来 对 待 所 有 的 语句 ， 也 就 是 说 ， 似 乎 所 有 的 语句 全 都 被 匹配 好 了 。 
要 反映 出 不 同 种 类 的 语句 ， 必 须 使 用 不 同 的 抽象 或 不 同 的 非 终结 符 。 下 面 列 出 的 是 基于 这 
种 思想 的 一 个 非 歧义 文法 : 130 
< 语句 > 一 < 匹配 _ 语 句 > | < 未 匹配 语句 > 
< 匹配 _ 语 句 > 一 if < 逻辑 表达 式 > then < 匹配 语句 > else < 匹配 _ 语 句 > 
| 任何 非 if 语句 
< 未 匹配 _ 语 句 > 一 if < 逻辑 表达 式 > then < 语句 > 
| if < 逻辑 表达 式 > then < 匹配 语句 > else < 未 匹配 语句 > 
运用 这 条 文法 ， 下 面 的 句 形 就 只 存在 唯一 可 能 的 语法 分 析 树 : 


if < 逻辑 _ 表达 式 > then if < 逻辑 表达 式 > then < 语句 > else < 语句 > 


3.3.2 扩展 的 BNF 


因为 BNF 在 某 些 方面 存在 着 些微 不 方便 之 处 ， 因 此 人 们 从 几 个 方面 对 它 进行 了 扩展 。 大 多 
数 扩 展 的 BNF 版 本 被 称 为 “扩展 的 BNF”， 或 者 简称 为 “EBNF” 一 一 尽管 这 些 扩展 的 版 本 不 尽 完 
全 相同 。 这 些 扩展 性 工作 并 不 提高 BNF 的 描述 能 力 ， 它 们 仅仅 增强 了 BNF 的 可 读 性 与 可 写 性 。 [131 
通常 ，EBNF 的 各 种 不 同 版 本 中 包括 三 项 扩展 。 第 一 项 扩展 是 说 明 RHS 中 的 可 选择 部 分 ， 并 
用 方 括号 将 这 些 部 分 括 起 来 。 例 如 ， 可 以 将 C 语 言 的 一 条 选择 语句 描述 为 
< 选择 > 一 if ( < 表达 式 > ) < 语句 > [ else < 语句 > 
如 果 不 使 用 方 括号 ， 这 条 语句 的 语法 描述 就 会 需要 两 条 规则 
< 选择 > 一 if ( < 表达 式 > ) < 语句 > 
if ( < 表达 式 > ) < 语句 > else < 语句 > 
第 一 项 扩展 ， 是 在 RHS 中 使 用 花 括 号 ， 表 明 可 以 无 限制 地 重复 花 括 号 包含 的 部 分 ， 或 者 就 
怎 完全 没有 。 这 项 扩展 允许 仅 使 用 一 条 规则 就 可 以 构造 链表 ， 而 不 是 使 用 递归 和 两 条 规则 ， 例 
如 ， 可 以 使 用 下 列 规则 来 描述 由 逗号 分 隔 的 标识 符 表 ， 
< 标识 符 _ 表 > 一 < 标识 符 > {，< 标 识 符 > } 
这 里 通过 一 种 隐 式 重复 替代 了 递归 ， 可 以 将 包含 在 花 括 号 之 内 的 部 分 重复 任意 次 数 ， 
第 三 项 常用 的 扩展 是 处 理 多 重 选择 的 选项 。 当 必须 从 一 组 元 素 中 选择 其 中 的 单个 元 素 时 、 
就 在 圆 括号 之 内 放 入 候选 项 ， 并 用 OR 操 作 符 的 记号 “|” 将 这 些 项 分 开 ， 例 如 
< 项 > 一 < 项 > (* | | & ) < 因子 > 
如 用 没有 这 项 扩展 , 就 需要 三 条 BNF 规 则 来 描述 上 述 的 结构 。 在 EBNF 扩 展 中 使 用 的 方 括号 
化 括号 和 圆 括号 是 元 符号 ,这 意味 着 它们 只 是 标记 的 工具 ， 而 不 是 用 以 帮助 描述 的 、 语 法 实体 
中 的 终结 符 。 有 时， 在 所 描述 的 语言 中 这 些 元 符号 也 被 用 作 终结 符 ， 表 示 终 结 符 的 实例 时 ， 可 
以 为 其 添加 下 划 线 或 者 使 用 引号 。 
BNF 的 规则 
< 表达 式 > 一 < 表达 式 > + < 项 > 
清楚 地 说 明了 (事实 上 是 强制 性 地 ) 加 法 操作 符 “+” 是 左 结合 的 。 然 而 EBNF 的 这 个 版 本 
< 表达 式 > 二 < 项 定之 项 3S 
却 没 有 隐 含 结合 性 的 方向 。 在 一 种 基于 EBNF 表 达 式 文法 的 语法 分 析 器 中 ， 关 于 这 个 问题 的 ”[539 
解决 是 通过 设计 语法 分 析 过 程 来 强制 施行 正确 的 结合 性 。 我 们 将 在 第 4 章 进 一 步 讨论 这 个 问题 ， 
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例 3.5 ”表达 式 文法 的 BNF 与 EBNF 版 本 


BNF 版本: RRA > — < 表达 式 > + < Wt > 
| < 表达 式 > -< 项 > 
| < 项 > 
< 项 > = < H> * < Af > 
| < 项 >/< 因子 > 
| < HF > 
< 因子 > 一 < 表达 式 > ** < 因子 > 
| < 表达 式 > 
< 表达 式 > > (< 表达 式 >) 
| < 标识 符 > 
表达 式 > 一 < 项 >{ (+ | =)< 项 >} 
项 > 3 
AF > |= s RA S H e RAR >) 
TARS = (< BRK >) 
| < 标识 符 > 


某 些 EBNF 的 版 本 允许 将 一 个 数值 上 标 附 于 花 括号 的 右 半 ， 用 以 说 明 所 包括 部 分 可 重复 次 数 
的 上 限 。 此 外 ,一些 版 本 还 使 用 加 号 (+) 上 标 来 标明 是 一 次 或 多 次 重复 。 例 如 ， 
< 复合 语句 > 一 begin < 语句 > { < 语句 > } end 
和 
< 复合 语句 > 一 begin { < 语句 > }* end 
为 等 价 的 。 
近年 来 ，BNF 和 EBNF 的 版 本 中 出 现 了 好 些 变异 。 其 中 包括 : 
。 使 用 冒号 “:” 来 代替 第 头 “ 一 "， 并 且 将 RHS 放 置 于 下 一 行 。 
。 不 使 用 竖 线 符 “|” 来 分 开 可 能 替代 的 RHS ， 而 是 将 这 些 RHS 放 置 于 不 同 的 行 。 
。 在 表示 可 选择 的 项 目 时 ， 不 使 用 方 括号 ， 而 是 使 用 下 标 “op 刀 。 例 如 ， 
构造 图 数 _ 声 明 器 一 简单 名 称 (形式 参数 _ 表 opt ) 
。 使 用 “one of”( 其 中 之 一 ) 来 表示 选择 , 而 不 是 在 一 组 括号 包括 的 元 素 中 使 用 竖 线 符 “|”。 
例如 ， 
赋值 _ 操 作 符 一 one of = *= /= %= += -= <<= >>= &= ^= |= 
EBNF 有 一 种 标准 ，ISO/IEC 14977 : 1996 (ISO/IEC, 1996), ， 但 是 很 少 被 使 用 。 这 个 标准 在 
规则 中 使 用 等 号 “=” 来 代替 箭头 “一 ”， 使 用 分 号 “;， ”来 终止 每 一 个 RHS， 并 且 在 所 有 终止 
符 上 都 要 求 有 引号 ， 而 且 还 指定 了 一 系列 的 其 他 标志 规则 。 


EBNF 版 本 ， 


< 
< 
< 
< 





3.3.3 文法 与 识别 器 


在 本 章 的 前 面 我 们 提出 ， 在 特定 语言 的 生成 装置 与 识别 装置 之 间 有 着 紧密 的 联系 。 事 实 上 ， 
给 定 一 个 上 下 文 无 关 文 法 ， 就 可 以 使 用 算法 方式 来 构造 由 这 条 文法 产生 的 语言 识别 器 。 许 多 构 
造 识别 器 的 软件 系统 已 经 被 开发 出 来 了 。 这 样 的 系统 可 以 很 快 产生 一 种 新 语言 编译 器 的 语法 分 
析 部 分 ， 因 而 相当 有 价值 。 最 早 的 语法 分 析 器 的 生成 器 之 一 ， 是 被 称 为 yacc 的 系统 ( 意 为 “ 另 
一 种 编译 器 的 编译 器 ") (Johnson, 1975) 。 现 在 已 经 有 了 很 多 这 样 的 系统 。 
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3.4 属性 文法 

属性 文法 是 一 种 用 来 描述 更 多 程序 设计 语言 结构 的 机 制 ， 而 这 些 结构 是 上 下 文 无 关 文 法 所 
不 能 描述 的 。 属 性 文法 是 上 下 文 无 关 文法 的 一 种 扩展 。 这 种 扩展 能 够 方便 地 摘 述 亲 些 语言 规则 ， 
例如 类 型 兼容 性 。 在 我 们 正式 定义 属性 文法 的 形式 之 前 ， 必 须 洽 清 静态 语义 的 概念 。 


3.4.1 静态 语义 


程序 设计 语言 结构 有 一 些 特 征 是 BNE 难 以 摘 述 的 ， 还 有 一 些 特征 则 是 BNEF 不 能 够 描述 的 。 
BNF 不 能 够 说 明 的 语言 规则 的 一 个 例子 是 类 型 兼容 性 规则 。 例 如 在 Java 语 言 中 ， 不 能 够 把 浮 点 
数值 赋 给 一 个 整数 类 型 的 变量 ， 尽 管 反方 向 的 赋值 是 合法 的 。 虽 然 这 种 限制 性 能 够 在 BNF 中 给 
予 说 明 , 但 是 需要 额外 增加 一 些 非 终 结 符 以 及 规则 。 如 果 Java 语 言 中 的 所 有 类 型 规则 都 必须 使 


用 BNF 来 说 明 ， 这 种 文法 就 会 过 于 庞大 ， 以 致 根本 无 法 使 
用 。 这 是 因为 文法 的 大 小 决定 着 语法 分 析 器 的 大 小 。 


BNF 不 能 摘 述 的 语言 规则 的 一 个 例子 是 这 样 一 条 通用 规 属性 文法 已 经 被 用 于 各 种 广 
则 : 在 引用 变量 之 前 必须 先 声 明 该 变量 。 可 以 证 明 ， 这 条 泛 的 应 用 之 中 。 它 们 被 用 于 提供 
规则 不 能 够 使 用 BNF 来 说 明 。 程序 设计 语言 语法 以 及 静态 语义 


列举 在 这 个 问题 之 中 的 语言 规则 类 型 就 称 为 静态 语义 ”“ 的 完 侣 档 述 (Watt, 1979), ei) 
规则 。 一 种 语言 的 静态 语义 仅仅 于 运行 时 与 程序 意义 间接 ”也 被 用 于 形式 地 害 义 一 种 可 以 输 
相关 ， 相 反 ， 它 与 程序 的 合法 形式 (语法 而 非 语 义 ) AK, ”个 到 编译 生成 系统 中 的 语言 
一 种 语言 的 多 种 静态 语义 规则 说 明 类 型 的 限制 。 之 所 以 被 (Farrow, 1982)， 它 们 还 被 作为 许 
命名 为 静态 语义 ， 是 因为 检测 这 些 规范 所 必需 的 分 析 能 够 。 多 语法 指 号 的 编辑 系统 的 基础 
在 编译 时 进行 。 ( Teitelbaum- Reps, 1981; 

由 于 使 用 BNF 描 述 静 态 语义 存在 一 些 问 题 ， 所 以 人 们 发 。“ Fischer et al., 1984), 此 外 ， 属 性 
明 出 了 各 种 功能 更 为 强大 的 机 制 。 其 中 的 一 种 机 制 便 是 属 。 文法 还 已 经 被 应 用 于 自然 语言 处 
性 文法 。 它 是 由 Knuth (Knuth, 1968a) 设计 的 ， 用 来 描述 AAV (Correa, 1992), 
程序 的 语法 以 及 程序 的 静态 语义 。 

属性 文法 是 用 来 描述 及 检测 程序 静态 语义 规则 正确 性 的 一 种 形式 方法 。 尽 管 在 编译 器 的 设 
计 中 ， 并 不 是 总 是 形式 地 使 用 这 种 文法 ， 但 至 少 每 一 个 编译 器 都 非 形式 化 地 采用 了 属性 文法 的 
基本 概念 (参阅 Aho etal., 1986, 第 5 章 ) 

动态 语义 将 在 3.5 节 中 讨论 。 


3.4.2 基本 概念 


属性 文法 是 一 些 增 加 了 属性 、 属 性 计算 函数 以 及 谓词 函数 的 上 下 文 无 关 文 法 。 与 文法 符号 
相关 联 的 属性 ， 就 它 能 够 被 赋值 的 意义 而 言 ， 与 变量 相 类 似 。 属 性 计算 函数 有 时 也 被 称 为 语义 
国 数 ， 与 文法 规则 相关 联 。 通 常 是 使 用 它们 来 说 明 如 何 计算 属性 值 。 谓 词 函数 用 于 说 明 语 言 能 
一 些 语法 规则 以 及 静态 语义 规则 ， 与 文法 规则 相关 联 。 

在 我 们 形式 地 定义 了 属性 文法 并 讨论 了 一 个 例子 之 后 ， 这 些 概念 将 会 更 为 清晰 。 


3.4.3 属性 文法 定义 
属性 文法 是 一 种 具有 下 列 附加 特性 的 文法 : 
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与 每 一 个 文法 符号 x 相关 联 的 是 一 个 属性 集合 A(X)。 集 合 A(X) 由 两 个 互 不 相交 的 集合 
S(X) 和 I(X) 组 成 。 这 两 个 集合 分 别 被 称 为 合成 属性 和 继承 属性 。 合 成 属性 用 于 在 语法 分 析 
树 中 往 上 传递 语义 信息 ， 而 继承 属性 则 用 于 穿 过 语法 分 析 树 往 下 传递 语义 信息 。 

与 每 一 条 文法 规则 相关 联 的 是 一 个 语义 函数 集合 ， 以 及 一 个 有 可 能 为 空 的 谓词 函数 集合 。 
这 些 函 数 作 用 于 与 符号 文法 规则 相关 的 属性 之 上 。 对 于 一 条 规则 Xo 一 X, … X,， 其 中 Xo 的 
合成 属性 由 形式 为 SCXo) = NAX), … , A(X,)) 的 语义 函数 来 计算 。 因 此 语法 分 析 树 上 一 个 
方 尽 的 合成 属性 值 仅仅 取决 于 这 个 节点 的 子 节点 属性 的 值 。 符 号 X;,，1 <j<n (上 述 规则 
中 的 元 素 ) 的 继承 属性 由 形式 为 I(X)) = (A(X), …, A(X,)) 的 语义 函数 来 计算 。 因 而 一 个 
分 析 树 市 扣 的 继承 属性 值 取决 于 这 个 节点 的 父 节点 以 及 兄弟 节点 的 属性 值 。 注 意 ， 为 了 
避免 迁 回 ， 继 承 属性 通常 被 限制 为 函数 形式 :I(X)) = AX), …, A(X0_1))。 这 样 就 防止 了 
继承 属性 依赖 于 它 的 自身 ， 或 者 依赖 于 语法 分 析 树 上 其 右边 节点 的 属性 。 

"谓词 函数 具有 布尔 表达 式 的 形式 ， 它 是 属性 集合 {A(Xo), …, A(X,)} 和 一 套 文字 属性 值 的 
并 集 。 属 性 文法 所 允许 的 唯一 派生 是 当 与 每 一 个 非 终 结 符 相 关 的 每 一 条 谓词 都 为 真 时 所 
产生 的 派生 。 为 假 的 谓词 函数 值 表示 违反 了 语言 的 语法 规则 或 者 语言 的 静态 语义 规则 。 

一 个 属性 文法 的 语法 分 析 树 是 基于 属性 文法 所 包含 BNF 的 语法 分 析 树 ， 其 中 每 一 个 节点 都 

附 上 了 有 可 能 为 空 的 属性 值 集合 。 如 果 已 经 计算 了 一 棵 语法 分 析 树 中 所 有 的 属性 值 ， 这 棵 树 就 
镁 称 为 完全 属性 的 。 在 编译 器 构造 了 一 棵 完整 非 属 性 语法 分 析 树 之 后 ， 通 常 可 以 方便 地 认为 它 
的 所 有 属性 值 都 已 经 被 计算 了 ， 虽 然 实际 上 并 不 总 是 这 样 。 


3.4.4 内 在 属性 


内 在 属性 是 语法 分 析 树 叶 节 点 的 合成 属性 ， 其 值 决定 于 分 析 树 之 外 。 例 如 ， 程 序 中 变量 实 
例 的 类 型 可 以 是 来 自 储存 变量 名 与 类 型 的 符号 表 ， 而 这 个 符号 表 的 内 容 又 由 前 面 的 声明 语句 来 
决定 。 假 设 在 初始 时 构造 了 一 棵 非 属性 语法 分 析 树 ， 但 又 要 求 有 属性 值 ， 此 时 具有 值 的 属性 就 
只 能 是 叶 市 点 的 内 在 属性 。 只 要 给 出 了 一 棵 语法 分 析 树 上 的 内 在 属性 值 ， 运 用 语义 函数 就 能 够 
计算 出 其 他 所 有 的 属性 值 。 


3.4.5 属性 文法 的 例子 


如 何 使 用 属性 文法 来 描述 静态 语义 ， 要 说 明 这 个 问题 ， 一 个 非常 简单 的 例子 是 下 面 用 来 描 
述 一 条 语法 规则 的 属性 文法 段 。 这 条 被 描述 的 语法 规则 为 ， 在 Ada 过 程 中 ， end 后 和 面 的 名 字 必 须 
与 过 程 名 相 匹配 。< 过 程 名 > 的 字符 串 属 性 ， 标 记 为 < 过 程 名 >. 字 符 串 ， 这 是 词法 分 析 器 所 发 现 的 
实际 字符 串 。 请 注意 ， 当 同一 个 非 终结 符 多 次 出 现 于 属性 文法 的 一 条 语法 规则 中 时 ， 就 要 使 用 
方 插 号 附 以 下 标 来 加 以 区 别 。 这 种 下 标 以 及 方 括号 都 不 是 被 描述 语言 的 部 分 。 

语法 规则 : < 过 程 _ 定 义 > 一 procedure < 过 程 _ 名 >[1] 

< 过 程 _ 体 > end < 过 程 _ 名 >[2]; 

谓词 : < 过 程 _ 名 >[1] .字符 串 == ”< 过 程 _ 名 >[2] .字符 串 

这 个 例子 中 的 谓词 规则 说 明 ， 子 程序 首部 的 < 过 程 _ 名 > 非 终结 符 的 名 字 串 属性 必须 与 子 程 
序 尾部 的 < 过 程 _ 名 > 非 终结 符 的 名 字 串 属性 相 匹 配 。 

下 面 ， 我 们 来 考虑 一 个 属性 文法 的 较 大 例子 。 这 个 例子 介绍 如 何 使 用 属性 文法 来 检查 一 条 
简单 赋值 语句 的 类 型 规则 。 下 面 是 这 条 赋值 语句 的 语法 与 语义 ， 变 量 名 只 有 A、 B 和 C。 赋 值 语 
名 右边 可 以 是 一 个 变量 或 者 一 个 变量 与 另 一 个 变量 相 加 的 表达 式 形式 。 变量 可 以 为 这 两 种 类 型 
中 的 一 种 ， 整 数 或 实数 。 当 有 两 个 变量 都 位 于 赋值 语句 的 右面 时 ， 它们 不 必 是 相同 的 类 型 。 当 
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操作 数 的 类 型 不 相同 时 ， 表达 式 的 类 型 总 是 实数 。 当 操作 数 的 类 型 相同 时 ， 表 达 式 的 类 型 就 是 
操作 数 的 类 型 。 赋 值 语句 左面 的 类 型 必须 与 右面 的 类 型 相 匹配 ， 所 以 尽管 右面 的 操作 数 可 以 为 
混合 类 型 ， 但 是 只 有 当 LHS 的 类 型 与 RHS 求 值 结果 的 类 型 相同 ， 这 一 条 赋值 语句 才 成 立 。 下 面 
的 属性 文法 就 说 明 这 些 语义 规则 。 

我 们 的 属性 文法 例子 的 语法 部 分 是 

< 赋值 语句 > 一 < 变量 > = < 表达 式 > 

< 表达 式 > 一 < 变量 > + < 变量 > 

| < 变量 > 
< 变量 > 一 人 |B | <C 


在 这 个 属性 文法 例子 中 ， 非 终结 符 的 属性 由 下 面 的 段落 给 予 描述 : 


。 实 际 _ 类 型 一 -与 非 终 结 符 < 变 量 > 和 < 表达 式 > 相 关联 的 一 种 合成 属性 。 这 种 合成 属性 用 来 
储存 变量 或 表达 式 的 实际 类 型 ， 即 为 整 型 或 实 型 。 对 于 变量 ， 实 际 类 型 是 内 在 的 。 而 对 


于 表达 式 ， 它 取决 于 非 终结 符 < 表 达 式 > 的 子 市 点 的 实际 类 型 。 


。 期 望 _ 类 型 一 一 与 非 终结 符 < 表达 式 > 相 关联 的 一 种 继承 属性 。 这 种 继承 属性 被 用 来 储存 表 


达 式 所 期 望 的 类 型 ， 或 者 是 整 型 或 者 是 实 型 ， 由 赋值 语句 左边 的 变量 类 型 所 决定 。 
完整 的 属性 文法 在 下 面 的 例 3.6 中 给 出 。 


例 3.6 简单 赋值 语句 的 一 种 属性 文法 


. 语法 规则 : < 赋值 _ 语 句 > 一 < 变量 > = < 表达 式 > 
语义 规则 : < 表达 式 > . 期望 _ 类 型 一 < 变量 > .实际 _ 类 型 
. 语法 规则 : < 表达 式 > 一 < 变量 >[2] + < 变量 >[3] 
语义 规则 : < 表达 式 > .实际 _ 类 型 一 
if ( < 变量 >[2] .实际 类 型 = 整 型 ) ana 
( < 变量 >[3] .实际 _ 类 型 = 整 型 ) 
then AI 
else 实 型 
end if 
谓词 : < 表达 式 > .实际 _ 类 型 = = < 表达 式 >. 期 望 _ 类 型 
. 语法 规则 : < 表达 式 > 一 < 变量 > 
语义 规则 : < 表达 式 > .实际 _ 类 型 一 < 变量 > .实际 _ 类 型 
谓词 : < 表达 式 > .实际 _ 类 型 = = < 表达 式 >. 期 望 类 型 
. 语法 规则 : < 变量 > 一 Al BIC 
语义 规则 : < 变量 > .实际 _ 类 型 一 查 表 ( < 变量 > .字符 串 ) 
查 表 函数 用 于 在 符号 表 中 查询 一 个 给 定 的 变量 名 ， 并 返回 这 个 变量 的 类 型 


图 3-6 显 示 了 一 个 语法 分 析 树 的 例子 ， 它 是 由 < 赋值 语句 > 
例 3.6 中 的 文法 产生 的 句子 A = A + B 的 语法 分 
析 树 。 与 上 面 文法 一 样 ， 将 包括 数字 的 方 括号 附 
加 在 分 析 树 中 重复 节点 的 标号 之 后 ， 这 样 它 们 就 
能 够 无 歧义 地 被 引用 。 


一 一 


N 


WwW 


D 











3.4.6 计算 属性 值 
< 变量 > < 变量 >[2] < 变量 >[3] 
现在 让 我 们 考虑 使 用 属性 装饰 语法 分 析 树 的 
过 程 。 如 果 所 有 属性 都 是 被 继承 的 ， 这 个 过 程 可 A = A + B 


以 完全 按照 日 上 而 下 的 顺序 ， 即 从 根 到 叶 来 进行 。 图 3-6 A = A + B 的 一 种 语法 分 析 树 
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但 是 ， 如 果 所 有 属性 都 是 被 合成 的 ， 这 个 过 程 可 以 完全 按照 自 底 而 上 的 顺序 ， 即 从 叶 到 根来 进 
行 。 因 为 我 们 的 文法 具有 两 种 属性 : 合成 属性 与 继承 属性 ， 所 以 求 值 的 过 程 就 不 能 仅 按照 任何 
一 个 单一 方向 。 下 面 所 列举 的 是 一 个 属性 求 值 的 过 程 ， 使 用 的 求 值 顺序 是 计算 这 些 属性 值 可 能 
采用 的 顺序 。 

1. < 变量 > .实际 _ 类 型 一 查 表 (A) (规则 4) 

2. < 表达 式 > .期 望 类 型 一 < 变量 > .实际 _ 类 型 (规则 1) 

3, < 变量 >[2 ] .实际 _ 类 型 一 查 表 (A) (规则 4) 

< 变量 >[ 3] .实际 _ 类 型 一 查 表 (B) (规则 4) 
4. < 表达 式 > .实际 _ 类 型 一 整 型 或 实 型 (规则 2) 
5. < 表达 式 > .期 望 _ 类 型 == < 表达 式 > .实际 _ 类 型 为 真 或 为 假 (规则 2) 


图 3-7 中 的 树 显示 了 图 3-6 例 子 中 的 属性 值 流 。 其 中 的 实 线 代 表 语法 分 析 树 ， 虚线 表示 树 中 
的 属性 流 。 
< 赋值 语句 > 






- -~ 


x 
期 望 类 型 < 表达 式 > 






4|\ 实 际 类 型 
/ x. 
< 变量 > 4 < 变量 >[2] 4 < 变量 >[3] 4 
A = A j + B í 


图 3-7 树 中 的 属性 流 


图 3-8 中 的 树 显示 节点 上 的 最 终 属性 值 。 在 这 个 例子 中 ，A 被 定义 为 实 型 ，B 为 整 型 ， 
企 使 用 属性 文法 的 一 般 情 况 下 ， 确 定 属性 求 值 的 顺序 是 一 个 复杂 的 问题 ， 通 常 需要 构造 一 
139| 个 依赖 图 ， 用 以 显示 所 有 属性 之 间 的 依赖 关系 。 
< 赋值 语句 > 






| 期 望 类 型 = 实数 类 型 
< 表达 式 > 实际 类 型 -实数 类 型 






实际 类 型 = <% 


实数 类 型 


< 变量 >[2] ”实际 类 型 = 
实数 类 型 


< 变量 >[3] ”实际 类 型 = 
整数 类 型 








A = A + B 


图 3-8 一 棵 完全 属性 的 语法 分 析 树 
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3.4.7 评估 


检测 语言 的 静态 语义 规则 是 所 有 编译 器 的 一 个 重要 部 分 。 即 使 一 个 编写 编译 器 的 人 员 从 来 
没有 听 说 过 属性 文法 ， 他 或 她 也 终 将 需要 使 用 属性 文法 的 基本 概念 来 设计 编译 器 中 检测 静态 语 
义 规则 的 部 分 。 

在 使 用 属性 文法 来 描述 当代 程序 设计 语言 中 所 有 的 语法 以 及 静态 语义 时 ， 主 要 的 困难 古文 
法 本 身 的 庞大 与 复杂 性 。 一 种 完整 的 程序 设计 语言 所 需要 的 大 量 属性 和 语义 规则 ， 使 得 这 种 文 
法 难 写 又 难 读 。 此 外 ， 从 一 棵 大 的 语法 分 析 树 求 取 属 性 值 的 代价 很 高 。 另 一 方面 ， 不 十 分 形式 
化 的 属性 文法 是 编译 器 编写 人 员 普 遍 使 用 的 功能 强大 的 工具 ， 这 部 分 人 员 对 产生 编译 器 的 过 程 
的 兴趣 大 大 超过 了 对 于 形式 主义 的 兴 


3.5 描述 程序 的 意义 : 动态 语义 


我 们 现在 转 到 描述 表达 式 、 语 名 以 及 程序 单元 的 动态 语义 或 意义 。 这 是 一 项 困难 的 工作 。 
鉴于 现行 标记 法 的 功能 及 自然 特征 ， 描 述 语法 是 一 件 相对 简单 的 事情 。 另 一 方面 ， 人 们 还 没有 
发 明 出 一 种 被 普遍 接受 的 动态 语义 标记 法 。 在 本 节 中 ， 我 们 将 简略 地 描述 几 种 已 经 开发 出 来 的 
方法 。 而 在 本 节 的 余下 部 分 ， 当 我 们 使 用 术语 “语义 ” 的 时 候 ， 指 的 就 是 动态 语义 ;我 们 将 使 
用 “静态 语义 ”来 表示 静态 语义 。 

人 们 之 所 以 关注 描述 语义 ， 可 能 有 几 种 不 同 的 理由 。 首 先 ， 程 序 人 员 显 然 需要 精确 地 知道 
语言 语句 的 用 途 。 他 们 通常 通过 阅读 语言 手册 中 的 英语 解释 来 发 现 语句 的 用 途 。 但 这 种 解释 常 
常 不 够 严密 也 不 完整 。 典 型 地 ， 编 译 器 的 编写 人 员 也 是 通过 英语 描述 来 确定 语言 的 语义 。 之 所 
以 使 用 这 些 非 形式 的 描述 ， 是 由 于 形式 化 的 语义 描述 中 所 存在 的 复杂 性 。 一 个 研究 目标 显然 是 ， 
让 程序 开发 人 员 以 及 编译 器 的 编写 人 员 都 能 够 使 用 一 种 语义 形式 。 

在 第 15 章 将 要 描述 的 一 种 函数 式 程序 设计 语言 Scheme 方 言 就 是 仅 有 的 少数 几 种 语言 的 定义 
包括 了 一 种 形式 语义 描述 的 程序 设计 语言 之 一 。 然 而 Scheme 方言 所 使 用 的 方法 将 不 在 本 章 描述 ， 
因为 本 章 的 注意 力 放 在 命令 式 语言 的 方法 上 。 


3.5.1 操作 语义 


操作 语义 的 思想 是 ， 通 过 把 语句 或 语言 翻译 成 一 种 更 容易 理解 的 语言 ， 从 而 描述 语句 或 程 
序 的 意义 。 

操作 语义 的 使 用 有 不 同 的 层次 。 在 高 级 层次 ， 关 注 的 是 完整 程序 的 最 终 执行 结果 ， 有 时 称 
之 为 自然 操作 语义 。 在 低级 层次 ， 通 过 检查 语句 的 翻译 版 本 ， 操 作 语义 能 用 来 决定 单一 语句 的 
精确 含义 ， 有 时 称 之 为 结构 操作 语义 。 

3.5.1.1 基本 过 程 

创建 一 种 语言 的 操作 语义 描述 的 第 一 步 是 设计 一 种 合适 的 中 间 语 言 ， 该 语言 的 最 基本 特征 
是 清晰 明确 。 该 中 间 语 言 的 每 一 步 构 建 都 有 明白 的 、 非 岐 义 的 意义 。 这 种 语言 是 中 级 语言 ， 因 
为 机 器 语言 太 低级 以 致 于 很 难 理解 ， 而 高 级 语言 也 显然 是 不 合适 的 。 如 果 语 义 描 述 能 用 作 自 然 
操作 语义 ， 那 么 虚拟 机 CPR aS) 肯定 能 构建 中 间 语 言 。 虚 拟 机 能 用 来 执行 单个 语句 、 代 码 段 
或 整个 程序 。 如 采 语 义 摘 述 用 于 结构 操作 语义 ， 虚 拟 机 就 是 不 必要 的 。 

操作 语义 的 基本 过 程 其 实 很 币 见 。 事 实 上， 这 种 概念 经 芝 被 用 于 程序 设计 教科 书 以 及 程序 设 
计 语 言 参考 手册 之 中 。 例 如 ，C 语 言 中 for 结 构 的 语义 就 可 以 使 用 非常 简单 的 指令 进行 描述 ， 如 
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CH6) 操作 语义 
for (exprl; expr2; expr3) { exprl; 
ame loop: if expr2 == 0 goto out 
} eo 
expr3; 
goto loop 


out: eee 


AIAN AIRS BE EMAI; HERRERA MEAT LAE EMH “th 
行 ” 定 义 中 的 指令 ， 并 且 能 够 识别 “执行 ”之 后 产生 的 效果 。 

作为 使 用 低层 次 语言 描述 操作 语义 的 一 个 例子 ， 考 虑 下 列 语句 ， 这 一 组 语句 足以 描述 一 种 
典型 程序 设计 语言 中 的 简单 控制 语句 。 


ident = var 

ident = ident +1 

ident = ident -1 

goto label 

if var relop var goto label 


在 这 些 语 句 中 ，re1lop 是 关系 操作 符 集合 { =, <>, >, <, >=, <= } 中 的 任意 一 个 ， 
ident 古 标识 符 ，var 可 以 是 标识 符 也 可 以 是 常量 。 所 有 的 这 些 语句 都 很 简单 ， 因 而 很 容易 被 
理解 和 实现 。 

对 上 述 三 条 赋值 语句 进行 一 般 化 处 理 ， 就 能 够 描述 更 为 一 般 的 算术 表达 式 和 赋值 语句 。 新 
的 语句 为 

ident = var bin_op var 

ident = un_op var 

这 里 的 bin_op 是 一 个 二 元 算术 操作 符 ， 而 un_op 是 一 个 一 元 操作 符 。 当 然 ， 多 样 的 算术 
数据 类 型 以 及 自动 类 型 转换 会 增加 这 种 一 般 化 的 复杂 程度 。 如 果 将 上 面 的 语句 再 增加 几 条 相对 
简单 的 指令 ， 就 能 够 描述 数组 、 记 录 、 指 针 以 及 子 程序 的 语义 。 

在 第 8 章 ， 我 们 将 运用 操作 语义 来 描述 各 种 控制 语句 。 

3.5.1.2 评估 

形式 .操作 语义 的 首要 也 是 最 重要 的 应 用 ， 是 用 于 描述 PL/I 语 言 的 语义 (Wegner, 1972), FB 
台 特 殊 的 抽象 机 器 ， 连 同 PL/I 语 言 的 翻译 规则 一 起 ， 被 称 为 维也纳 定义 语言 (Vienna Definition 
Language, VDL)。 这 个 名 称 源 于 IBM 设 计 这 种 定义 语言 所 在 的 城市 名 。 

操作 语义 为 语言 的 使 用 人 员 以 及 语言 的 实现 人 员 提 供 了 一 种 描述 语义 的 有 效 方法 。 其 前 提 
尽 要 能 够 保持 这 种 描述 的 简单 化 及 非 形式 化 。 但 PL/I 语 言 的 VDL 描 述 过 于 复杂 ， 以 致 实际 上 不 
能 够 达到 这 个 目的 。 

操作 语义 依赖 于 较 低 层次 的 程序 设计 语言 ， 而 不 是 数学 。 借 助 一 种 低层 次 程序 设计 语言 也 
语句 来 描述 某 一 种 程序 设计 语言 的 语句 ， 这 种 方式 可 能 导致 迁 回 ， 即 一 些 概 念 会 闻 接 地 定义 于 
它们 的 自身 。 在 下 面 两 个 小 节 里 将 要 描述 的 方法 ， 从 基于 逻辑 与 数学 而 非 机 器 的 意义 上 来 说 ， 
要 更 加 形式 化 。 


3.5.2 公理 语义 


公理 语义 的 定义 是 与 一 种 证 明 程 序 正 确 性 的 方法 同时 开发 的 。 当 能 够 构造 这 种 正确 性 证 
明 时 ， 正 确 性 证 明 表明 程序 能 够 按照 说 明 进 行 运算 。 在 证 明 中 ， 程 序 中 每 一 条 语句 的 前 后 都 
分 别 放置 了 一 条 给 程序 中 变量 设置 限制 的 逻辑 表达 式 。 正 是 这 些 逻 辑 表 达 式 (而 不 是 抽象 机 


器 的 总 状态 ， 如 操作 语义 的 情形 ) 被 用 来 描述 语句 的 意义 。 用 于 描述 限制 的 标记 法 一 一 即 公 
理 语 义 的 语言 ， 就 是 谓词 演算 。 尽 管 简单 布尔 表达 式 通 常 可 以 表达 这 种 限制 ， 但 有 时 却 不 够 
充分 。 

当 公 理 语义 用 于 形式 化 指定 语句 的 语义 时 ， 其 含义 由 语句 对 断言 (关于 该 语句 所 处 理 的 
数据 ) 的 影响 来 定义 。 

3.5.2.1 断言 

公理 语义 以 数理 逻辑 为 基础 时 ， 这 些 逻 辑 表 达 式 就 被 称 为 谓词 或 者 断言 (assertion), KE 
于 一 条 程序 语句 之 前 的 断言 ， 说 明 程 序 运 行 到 该 处 时 对 变量 的 限制 。 而 紧 跟 在 一 条 语句 后 面 的 
言 ， 则 说 明 在 这 条 语句 运行 之 后 对 于 这 些 变量 (以 及 其 他 可 能 的 变量 ) 的 新 限制 。 这 两 种 断 
言 分 别 被 称 为 这 条 语句 的 前 置 条 件 和 后 置 条 件 。 对 于 两 条 邻接 语句 而 言 ， 第 一 条 的 后 置 条 件 是 
第 二 条 的 前 置 条 件 。 开 发 给 定 程 序 的 公理 描述 或 证 明 ， 则 要 求 在 程序 中 的 每 一 条 语句 都 同时 具 
有 前 置 条 件 和 后 置 条 件 。 

在 下 面 的 几 个 小 市 里 ， 我 们 将 运用 这 种 观点 来 检测 断言 ， 即 ， 从 给 定 的 后 置 条 件 能 够 求解 
前 置 条 件 ， 当 然 也 可 以 从 相反 的 方向 进行 检测 。 我 们 假设 所 有 变量 都 为 整 型 。 作 为 一 个 简单 的 
例子 ， 考 虑 下 面 的 赋值 语句 及 其 后 置 条 件 : 


sum = 2 * x + 1 {sum > 1} 


为 了 便于 与 程序 语句 相 区 别 ， 将 前 置 条 件 与 后 置 条 件 断 言 都 包括 在 花 括 号 之 中 。 这 条 语句 
的 一 个 可 能 的 前 置 条 件 是 { x > 10 }。 

在 公理 语义 中 ， 一 种 特定 语句 的 含义 由 计算 该 种 语句 前 置 条 件 的 过 程 并 附带 其 后 置 条 件 来 
定义 。 实 际 上 ， 就 逻辑 表达 式 而 言 ， 此 过 程 精确 地 指定 了 执行 语句 的 效果 。 

在 接 下 来 的 小 市 中 ， 我 们 关注 语句 和 程序 的 正确 性 证 明 ， 这 是 公理 语义 的 常见 运用 。 公 理 
语义 的 更 多 的 通用 概念 会 以 逻辑 表达 式 的 形式 来 精确 叙述 语句 和 程序 的 意义 。 程 序 验 证 是 语言 
公理 摘 述 的 一 种 运用 。 

3.5.2.2 最 弱 前 置 条 件 

最 弱 前 置 条 件 是 限制 最 少 的 前 置 条 件 ， 它 将 保证 相关 联 的 后 置 条 件 的 有 效 性 。 例 如 ， 在 上 
述 的 赋值 语句 及 其 后 置 条 件 中 ，{x > 10}、{x > 50} 和 {x > 1000} 都 是 有 效 的 前 置 条 件 。 
此 时 ， 所 有 前 置 条 件 中 最 弱 的 一 个 是 {x > 0}, 

如 采 对 于 采种 语言 中 的 每 一 条 语句 ， 都 可 以 从 最 通用 的 后 置 条 件 求 出 它 的 最 弱 前 置 条 件 ， 
那么 ， 用 于 计算 这 些 前 置 条 件 的 过 程 就 为 那 种 语言 的 语义 提供 了 简要 的 描述 。 而 且 ， 正 确 性 证 
明 能 用 那 种 语言 编写 的 程序 来 构建 。 程 序 证 明 从 使 用 所 需要 的 程序 执行 结果 开始 ， 作 为 程序 最 
后 一 条 语句 的 后 置 条 件 。 这 个 后 置 条 件 连 同 最 后 一 条 语句 一 道 ， 被 用 来 计算 最 后 一 条 语句 的 最 
能 前 置 条 件 。 然 后 这 个 前 置 条 件 又 被 用 来 作为 倒数 第 二 条 语句 的 后 置 条 件 。 这 个 过 程 一 直 继续 
到 程序 首部 为 止 。 而 程序 第 一 条 语句 的 前 置 条 件 就 表示 了 能 够 使 程序 计算 出 所 需 结 果 的 条 件 。 
如 果 程序 的 输入 说 明 隐 含 了 这 个 条 件 ， 这 个 程序 就 已 经 证 明 是 正确 的 。 

推理 规则 是 一 种 以 其 他 断言 值 为 基础 推断 出 一 个 断言 真 值 的 方法 。 推 理 规则 的 一 般 形式 如 下 : 

Sly SZ; «a. ‘SH 

S 


上 式 说 明 ， 如 果 S1， SA » rire Sn 为 真 ， 那么 S 的 真 值 就 能 推出 。 推理 规则 的 上 面部 分 叫做 
前 件 (antecedent), ， 下 面部 分 叫做 后 件 (consequent), 
公理 是 一 条 假定 为 真 的 逻辑 语句 。 然 而 ， 公 理 是 一 条 没有 前 件 的 推理 规则 。 
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对 于 茶 些 程序 语句 ， 由 语句 及 其 后 置 条 件 来 推出 最 弱 前 置 条 件 是 简单 的 ， 而 且 能 够 使 用 一 
条 公理 来 说 明 。 然 而 在 大 多 数 情 况 下 ， 只 能 通过 推理 规则 来 求 得 最 弱 前 置 条 件 。 

在 给 定 程序 设计 语言 中 运用 公理 语义 ， 无论 是 用 于 正确 性 证 明 或 者 形式 语义 的 说 明 ， 对 于 
语言 中 每 一 类 型 的 语句 ， 都 必须 定义 公理 或 推理 规则 。 在 下 面 的 几 个 小 节 中 ， 我 们 将 给 出 赋值 
语句 的 一 条 公理 ， 以 及 对 于 语句 系列 、 选 择 语句 和 逻辑 先 测 试 循环 的 一 些 推理 规则 。 请 注意 ， 
我 们 假设 算术 表达 式 以 及 布尔 表达 式 都 没有 副作用 。 

3.5.2.3 赋值 语句 

赋值 语句 的 前 置 条 件 和 后 置 条 件 共 同 精确 定义 赋值 语句 的 含义 。 因 此 ， 为 了 定义 赋值 语句 
的 含义 ， 我 们 需要 能 计算 它 的 前 置 条 件 。 

假设 x = E 为 一 般 赋值 语句 ，8 为 它 的 后 置 条 件 。 这 条 语句 的 前 置 条 件 P 由 下 列 公理 来 定义 : 

P= .Sp 

它 的 意义 为 ， 将 Q@ 中 所 有 x 的 实例 都 替换 成 E， 就 可 以 由 8 计算 出 P 值 。 例 如 ， 如 果 我 们 有 如 
下 的 赋值 语句 以 及 后 置 条 件 

a=b/2-1{a< 10} 

了 节约 前 置 条 件 由 b / 2 - 1 替换 后 置 条 件 {a < 10} 来 计算 ， 如 下 所 示 : 

了 

= 22 

因此 ， 这 条 赋值 语句 及 其 后 置 条 件 的 最 弱 前 置 条 件 为 {b < 22}。 请 注意 ， 只 有 在 没有 副 
作用 的 情况 下 赋值 公理 才 为 真 。 如 果 一 条 赋值 语句 改变 了 一 些 变量 值 而 不 是 赋值 号 左边 的 值 ， 
则 这 一 条 赋值 语句 具有 副作用 。 

说 明 给 定 句 型 的 公理 语义 的 常用 标记 方法 是 

{P} S {Q} 

这 里 ，P 是 前 置 条 件 ，Q 是 后 置 条 件 ，s 是 句 型 。 上 面 的 赋值 语句 的 标记 是 

{Qe} x = E {Q} 

作为 计算 赋值 语句 前 置 条 件 的 另外 一 个 例子 ， 考 虑 下 面 的 赋值 语句 及 其 后 置 条 件 : 

x 2 3 tx > 25} 

它 的 前 置 条 件 计 算 如 下 : 

2* y = 3 > 25 

y > 14 

因此 {y > 14} 是 这 一 条 赋值 语句 及 其 后 置 条 件 的 最 弱 前 置 条 件 。 

和 注意， 赋值 语句 的 左边 出 现在 这 条 语句 右边 ， 并 不 影响 最 弱 前 置 条 件 的 计算 过 程 。 例 如 ， 
对 于 

03 

其 最 弱 前 置 条 件 是 

xt y= 3 > 10 

y > 13 = X 

在 讨论 开始 时 ， 我 们 曾经 说 明 公 理 语 义 是 为 证 明 程序 正确 性 而 开发 的 。 在 这 个 前 提 之 下 ， 
读者 现在 自然 会 问 : 如 何 能 够 使 用 赋值 语句 的 公理 来 证 明正 确 性 。 我 们 给 出 的 回答 是 ， 可 以 认 
为 具有 前 置 条 件 和 后 置 条 件 的 赋值 语句 是 一 条 定理 。 如 果 将 赋值 公理 作用 于 后 置 条 件 以 及 这 条 


赋值 语句 之 上 时 ， 产 生 了 所 给 定 的 前 置 条 件 ， 这 条 定理 便 得 到 了 证 明 。 例 如 ， 考 虑 逻辑 命题 

{x > 3} x = x =— 3 {x > 0} 

实施 赋值 公理 于 

x = x - 3 {x > 0} 
会 产生 {x > 3}， 这 正 是 所 给 定 的 前 置 条 件 ， 因 而 证 明了 上 面 的 逻辑 命题 是 正确 的 。 

下 面 ， 再 考虑 逻辑 命题 

{x >5} x =x - 3 {x > 0} 

在 这 种 情况 下 ， 所 给 定 的 前 置 条 件 {x > 5} 不 同 于 公理 所 产生 的 断言 。 然 而 { x > 5 } = 
> {x> 3 } 显 然 成 立 。 为 了 将 它 纳入 证 明之 中 ， 我 们 需要 名 为 后 果 规 则 的 推理 规则 。 

后 采 规 则 的 形式 为 

IP} S {Q}, P'=>P, Q=>Q’ 

{P}S{Q} 

这 里 ， 符 号 => 的 意义 是 “蕴涵 ”， 并 且 S 可 以 为 任意 的 程序 语句 。 可 以 使 用 下 面 的 文字 来 表述 
这 一 条 规则 如果 人 逻辑 命题 {P}S{Q} 为 真 ， 断 言 P' 蕴涵 断言 P， 断 言 0 薄 涵 断言 0' ， 那 么 就 能 
推断 出 {P'}S{Q'}。 换 言 之 ， 后果 规则 说 明 的 是 ， 后 置 条 件 总 是 能 够 被 变 弱 ， 而 前 置 条 件 总 是 
能 够 被 增强 。 这 在 程序 证 明 当中 是 相当 有 用 的 。 例 如 ， 它 能 够 允许 我 们 完成 上 面 最 后 一 个 例子 
中 逻辑 命题 的 证 明 。 如 果 我 们 让 P 为 {x > 3}，Q 和 Q' 为 {x > 0}, P' 为 {x > 5}， 那 么 我 们 
就 有 

{xX > 3 3 {x > 0}; (x > 5j=>{x > 3), (x > 0)=>(x > 0) 

{x >-5} x =x - 3 {x > 0} 

前 件 中 的 第 一 项 ({ x > 3 } x = x - 3 { x > 0 }) 由 赋值 公理 证 明 。 第 二 和 第 三 
项 是 明显 的 。 因 而 ， 通 过 使 用 后 果 规 则 ， 后 件 为 真 。 

3.5.2.4 序列 

公理 不 能 够 描述 语句 序列 的 最 弱 前 置 条 件 ， 因 为 前 置 条 件 取决 于 语句 序列 中 某 些 特 殊 类 型 
的 语句 。 在 这 种 情况 下 ， 就 只 能 够 使 用 一 条 推理 规则 来 描述 前 置 条 件 。 假 设 S1 和 8S2 是 相 邻 的 两 
条 程序 语句 。 如 果 S1 和 8S2 分 别 具 有 下 面 的 前 置 条 件 与 后 置 条 件 

{P1} S1 {P2} 

{P2} S2 {P3} 

对 于 这 样 一 个 两 条 语句 的 序列 ， 其 推理 规则 是 


{P1} S1 {P2}, {P2} S2 {P3} 
~— {PI} Sl; 52 {P3} ~ 





因而 ， 对 于 上 述 例子 ，{ Pl } S1; S2 { P3 } 描 述 了 序列 S1; S2 的 公理 语义 。 这 条 
推理 规则 说 明 ， 要 想 求 得 序列 的 前 置 条 件 ， 必 须 先 计算 第 二 条 语句 的 前 置 条件 。 然 后 将 新 计算 
出 的 断言 用 作 第 一 条 语句 的 后 置 条 件 ， 然 后 可 以 使 用 它 来 作为 第 一 条 语句 以 及 整个 序列 的 前 置 
条 件 。 如 果 S1 和 S2 分 别 是 赋值 语句 

xl =E1 
和 

x2 = E2 
那么 我 们 就 有 
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形 。 


{P3. yu} x2 = E2 {P3} 
{(P3.2_562)x1-5E1) xl=El {P3.2_yk2} 

因而 ， 后 置 条 件 为 P3 的 序列 xl = El; x2 = E2 的 最 弱 前 置 条 件 是 {( P32 .sz ) xi -sl}。 
例如 ， 考 虑 下 面 的 序列 及 其 后 置 条 件 ， 


YY 


x= y + J 

{x < 10} 

上 面 最 后 一 条 赋值 语句 的 前 置 条 件 为 
y= 7 


然后 ， 这 个 条 件 被 用 作 第 一 条 语句 的 后 置 条 件 。 现 在 我 们 可 以 来 计算 第 一 条 语句 的 前 置 条 件 : 
3*x+ kt < 7 l 

x < 2 

3.5.2.5 选择 

Bole PRG EAE HERE), VERRIER SKA 

if B then Sl else S2 

我 们 仅 考 虑 包括 else 子 句 的 选择 。 其 推理 规则 为 


{B and P} S1 {Q}, {(not B) and P} S2 {Q} 
{P} if B then Sl else S2 {Q} 


这 条 规则 说 明 必 须 证 明 选 择 语句 的 两 种 情形 ， 即 当 布 尔 表达 式 的 值 为 真 以 及 为 假 的 两 种 情 
位 于 横 线 上 方 的 第 一 条 逻 辑 语句 代表 then 子 句 ， 第 二 条 逻辑 语句 代表 else 子 句 。 根 据 推 


理 规 则 ， 我 们 需要 一 个 能 够 用 于 这 两 条 子 句 〈 即 then 子 句 和 else 子 句 ) 的 前 置 条 件 P。 


考虑 下 面 运用 选择 推理 规则 计算 前 置 条 件 的 例子 。 例 子 中 的 选择 语句 是 
if (x > 0) 
yy =k 
else y = y + 1 
假设 这 条 选择 语句 的 后 置 条 件 o 是 { y > 0 }， 我 们 就 能 够 使 用 公理 来 对 then 子 句 赋值 
和 
这 就 产生 了 { y - 1 > 0 } 或 { y > 1 }。 现 在 我 们 对 else 子 句 运 用 相同 的 公理 
y= y ¢ I fy > 0} 
这 就 产生 了 前 置 条 件 { y + 1 > 0 } 或 者 { y> -1 }。 因为 { y>1}=>> {y> 
}， 后 来 规则 允许 我 们 使 用 { y > 1 } 作 为 整个 选择 语句 的 前 置 条 件 。 
3.5.2.6 逻辑 先 测试 循环 
命令 式 程序 设计 语言 的 另 一 种 基本 结构 是 逻辑 先 测 试 循环 ， 或 while 循 环 。 计 算 while 循 


环 的 最 罚 前 置 条 件 本 质 上 比 计算 语句 序列 的 最 弱 前 置 条 件 更 为 困难 ， 因 为 不 是 在 所 有 情况 下 都 
能 够 预先 确定 循环 中 的 重复 次 数 。 在 预先 知道 重复 次 数 的 情况 下 ， 可 以 将 循环 作为 序列 来 处 理 。 


计算 循环 最 弱 前 置 条 件 的 问题 与 求证 有 关 所 有 正 整数 的 定理 的 问题 相 类 似 ， 后 者 通常 是 运 


用 与 纳 法 来 证 明 ， 因 而 同样 的 归纳 方法 也 能 够 运用 于 循环 。 归 纳 法 中 的 主要 步骤 是 要 找 出 一 种 
归纳 假设 。 在 while 循 环 的 公理 语义 中 的 相应 步骤 则 是 找 出 一 种 被 称 为 循环 不 变 式 的 断言 ， 这 
个 步骤 是 计算 循环 最 弱 前 置 条 件 的 关键 。 


计算 一 个 whi le 循环 前 置 条 件 的 推理 规则 是 


(I and B) S {I} 

{I} while B do S end {I and (not B)} 

这 里 的 I 是 循环 不 变 式 。 这 个 推理 看 起 来 简单 ， 其 实 却 不 然 。 事 情 的 复杂 性 在 于 要 找到 一 
条 合适 的 循环 不 变 式 。 

一 个 while 循 环 的 公理 描述 可 以 写 为 

{P} while B do S end {Q} 

循环 不 变 式 必须 满足 许多 要 求 才 能 够 有 有 用。 首先 ， 这 个 while 循 环 的 最 弱 前 置 条 件 必 须 能 
够 保证 循环 不 变 式 为 真 。 而 反 过 来 ， 循 环 不 变 式 则 必须 保证 后 置 条 件 在 循环 终止 时 为 真 。 这 些 
限制 将 我 们 从 推理 规则 过 滤 到 公理 描述 。 在 循环 执行 的 期 间 ， 循 环 不 变 式 的 真 值 不 能 受 控制 循 
环 的 布尔 表达 式 的 求 值 以 及 循环 体内 语句 的 影响 。 这 就 是 名 称 “ 不 变 式 ” 的 由 来 。 

while 循 环 的 另 一 个 复杂 因素 是 循环 终止 的 问题 。 如 果 @ 是 在 循环 终止 时 即刻 成 立 的 后 置 
条 件 ， 那 么 前 置 条 件 P 则 保证 循环 终结 时 @ 能 够 成 立 ， 并 且 能 够 保证 循环 的 确 终 止 。 

一 个 while 结 构 的 完整 的 公理 描述 需要 所 有 下 列 的 各 项 都 为 真 ， 其 中 I 是 循环 不 变 式 ; 

P'=> I 

{I and B} S {I} 

(I and (not B)) => Q 

要 找到 循环 不 变 式 ， 我 们 可 以 运用 一 种 类 似 于 数学 归纳 法 中 决定 归纳 假设 时 使 用 的 方法 。 
这 种 方法 如 下 所 述 : 计算 一 些 情形 中 的 关系 ， 希 望 能 够 从 中 发 现 适用 于 一 般 情形 的 模式 。 这 时 
候 ， 将 产生 最 弱 前 置 条 件 的 过 程 处 理 为 一 个 函数 wp 会 很 有 帮助 。 通 常 

wp ( lit), 后 置 条 件 ) = 前 置 条 件 

为 了 找到 I， 我 们 使 用 循环 后 置 条 件 0， 从 零 次 开始 对 循环 体 反复 运算 几 次 ， 用 以 计算 循环 
的 前 置 条 件 。 如 果 循 环 体 包含 了 单条 赋值 语句 ， 赋 值 语句 的 公理 可 以 用 来 计算 这 种 情形 。 考 虑 
while y <> x do y = y + 1 end {y = x} 
请 记 住 ， 这 里 的 等 号 被 用 于 两 种 不 同 的 目的 : 在 断言 中 ， 它 意味 着 数学 里 的 相等 ， 在 断言 
它 意 味 着 赋值 操作 符 。 
对 于 零 次 循环 ， 其 最 弱 前 置 条 件 显然 是 
ty = 3 
对 于 一 次 循环 ， 其 最 弱 前 置 条 件 是 
WP 全 + 了 Or 
对 于 两 次 循环 ， 它 是 
WP (Y = F+ ln {y =x lg {t= = a2} 
对 于 三 次 循环 ， 它 是 
apy = y +i {y= xe yey taaa joriy g o 
现在 已 经 很 清楚 ，{ y < x } 在 一 次 或 多 次 循环 的 情况 下 ， 都 足以 保证 后 置 条 件 成 立 。 结 
合 零 次 循环 情形 中 的 { y = x }, 我们 得 出 : 能 够 使 用 { y <= x } 作 为 循环 不 变 式 . while 
语句 的 前 置 条 件 则 可 以 由 循环 不 变 式 确定 。 事 实 上 ，I 就 可 以 用 作 前 置 条 件 P。 

对 于 例子 中 的 循环 ， 我 们 必须 确保 我 们 的 选择 满足 I 的 四 个 标准 。 第 一 ， 因 为 P = 1, 所 
LAP => I。 第 二 个 要 求 是 ， 


外 
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{I and B} S {I} 

在 我 们 的 例子 中 ， 我 们 有 

(1y s= E and y <2 apy = + A <x} 

运用 赋值 公理 到 下 面 的 公式 上 

y =y t AY 

我 们 得 到 {y + 1 <= x}， 它 等 价 于 {y < x}, #EAME{y <= x and y <> x}Z% 
中 。 因 而 ， 上 面 的 关系 已 经 得 到 证 明 。 

下 面 ， 我 们 必须 有 

{I and (not B)} => Q 

在 我 们 的 例子 中 ， 我 们 有 

{(y <= x) andnot (y <> x)} => {y = x} 

{(y <= x) and (y = x)} => {y = x} 

Ly = Sy SP Ay = Sy 

因此 ， 上 述 的 表达 式 显然 为 真 。 再 下 一 步 ， 必 须 考 虑 循环 的 终止 。 在 这 个 例子 中 ， 我 们 的 
问题 是 循环 

{y <= x} while y <> x do y = y + 1 end {y = x} 
ERAI 回忆 我 们 曾经 假定 x 和 Y 为 整数 变量 ， 这 样 就 很 容易 看 出 这 个 循环 的 确 会 终止 。 前 置 
条 件 保证 y 初 始 时 不 大 于 x。 循 环 体 的 每 一 次 重复 都 增加 y 的 值 ， 直 到 y 与 x 相 等 。 无 论 y 的 初始 
值 比 x 小 多 少 ， 它 最 终 将 和 x 相等 。 到 时 候 ， 循 环 将 会 结束 。 因 为 我 们 选择 的 I 满足 所 有 的 四 项 
标准 ， 因 而 它 足 以 充当 循环 不 变 式 以 及 循环 前 置 条 件 。 

上 面 用 来 计算 循环 不 变 式 的 过 程 并 不 一 定 总 是 能 够 产生 最 弱 前 置 条 件 的 断言 (尽管 在 上 面 
的 例子 里 是 如 此 )。 

作为 使 用 数学 归纳 法 求 取 循 环 不 变 式 的 另 一 个 例子 ， 考 虑 下 面 的 循环 语句 : 

while s > 1 do s = s / 2 end {s = 1} 

与 前 面 一 样 ， 我 们 使 用 赋值 公理 来 试图 找到 这 个 循环 的 循环 不 变 式 以 及 前 置 条 件 。 对 于 零 
次 循环 ， 最 弱 前 置 条 件 是 { s = 1 }。 对 于 一 次 循环 ， 它 是 

wp(s = s / 2, {s = 1}) = {8 / 2 = 1}, or{s = 2} 

对 于 二 次 循环 ， 它 是 

wp(s = s / 2, {s = 2}) = {s / 2 = 2},or{s = 4} 

对 于 三 次 循环 ， 它 是 

wp(s =s / 2, {s = 4}) = {s / 2 = 4},or{s = 8} 

从 以 上 这 几 种 情形 中 ， 我 们 就 能 够 清楚 地 看 出 ， 这 个 循环 的 循环 不 变 式 为 

{ s 是 2 的 一 个 非 负 次 圭 } 
再 一 次 ， 计 算出 来 的 I 可 以 用 作 P， 而 且 I 也 通过 了 上 述 四 项 要 求 。 与 我 们 在 前 面 例子 中 所 求 取 的 
循环 前 置 条 件 不 同 的 是 ， 这 次 计算 的 I 显然 不 是 最 弱 前 置 条 件 。 考 虑 使 用 前 置 条 件 { s > 1 }。 
逻辑 命题 


{s > 1} while s > 1 do s = s / 2 end {s = 1} 


就 能 够 很 容易 被 证 明 ， 而 且 它 的 前 置 条 件 的 范围 比 在 前 面 计 算 的 前 置 条 件 的 范围 大 得 多 。 正 如 
这 一 过 程 所 显示 的 ， 对 于 任何 为 正 的 s 值 ， 不 仅 是 2 的 因 ， 这 个 循环 及 其 前 置 条 件 都 能 够 得 到 满 
足 。 运 用 后 果 规 则 我 们 得 知 ， 采 用 比 最 弱 前 置 条 件 更 强 的 前 置 条 件 都 不 会 使 得 证 明 无 效 。 

求 取 循环 不 变 式 并 非 总 是 这 么 容易 。 了 解 一 些 不 变 式 的 性 质 会 有 所 帮助 。 首 先 ， 循 环 不 变 
式 是 削弱 了 的 循环 后 置 条 件 版 本 ， 同 时 又 是 循环 的 前 置 条 件 。 因 此 I 必 须 足 够 的 弱 ， 以 便 满 足 
循环 开始 执行 之 前 的 条 件 ， 但 是 结合 了 人 循环 终止 条 件 之 后 ， 它 又 必须 足够 的 强 ， 以 便 足 以 强制 
后 置 条 件 为 真 。 

因为 求证 循环 终止 很 困难 ， 所 以 这 条 要 求 第 常 被 忽略 。 如 果 循 环 的 终止 能 够 被 证 明 ， 就 称 
循环 的 公理 描述 具有 完全 正确 性 。 如 果 其 他 的 条 件 都 能 够 满足 ， 但 是 不 能 够 保证 循环 的 终止 ， 
这 时 就 称 循 环 的 公理 拉 述 具有 部 分 正确 性 。 

在 更 复杂 的 循环 中 ， 即 使 只 是 为 了 部 分 正确 性 ， 也 需要 极 具 技巧 才能 求 得 合适 的 循环 不 变 
式 。 因 为 计算 while 循 环 的 前 置 条 件 依赖 于 找到 一 个 循环 不 变 式 ， 因 而 使 用 公理 语义 来 求证 具 
有 while 循 环 的 程序 正确 性 ， 会 是 十 分 困难 的 。 

3.5.2.7 程序 证 明 

本 六 提供 对 两 个 简单 程序 的 验证 。 第 一 个 正确 性 证 明 的 例子 是 一 个 很 短 的 程序 ， 仅 仅 包括 
三 条 赋值 语句 序列 ， 用 于 交换 两 个 变量 的 值 。 

{x = A AND y = B} 

€ x 

x = yi 

y= 

{x = B AND y = A} 

因为 这 一 条 程序 完全 由 赋值 语句 序列 组 成 ， 从 而 可 以 使 用 赋值 公理 以 及 序列 语句 的 推理 规 
则 来 证 明 程序 的 正确 性 。 第 一 个 步骤 ， 是 对 最 后 一 条 语句 以 及 整个 程序 的 后 置 条 件 运用 赋值 公 
理 。 这 样 就 产生 了 前 置 条 件 | 

{x = B AND t = A} 

下 一 步 ， 我 们 用 这 个 新 的 前 置 条 件 作 为 中 间 语 名 的 后 置 条 件 ， 并 计算 中 间 语 句 的 前 置 条 件 ， 
即 为 

{y = B AND t = A} 

再 下 一 个 步骤 ， 我 们 使 用 这 个 新 的 断言 作为 第 一 条 语句 的 后 置 条 件 ， 并 且 再 次 运用 赋值 公 
理 ， 这 样 就 产生 了 


{y = B AND x = A} 
除了 AND 操 作 符 的 操作 数 的 顺序 之 外 ， 这 与 程序 的 前 置 条 件 完 全 相同 。 由 于 AND 是 一 个 对 称 操 
作 符 ， 我 们 的 证 明 已 经 完成 。 

下 面 的 例子 是 一 个 计算 阶乘 函数 的 虚拟 码 程 序 的 正确 性 证 明 。 


{n >= 0} 
count = n; 
fact = 1; 


while count <> 0 do 
fact = fact * count; 
count = count - 1; 

end 

{fact = n!} 
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前 面 所 描述 的 求 取 循环 不 变 式 的 方法 对 于 这 个 例子 中 的 循环 无 效 。 在 这 里 需要 一 些 技巧 ， 还 需 
要 对 这 段 代 码 进行 粗略 的 研究 。 这 个 循环 以 大 数 相 乘 先 运算 的 顺序 来 计算 阶乘 ， 即 当 n 大 于 1 时 ， 
先 计 算 ( n - 1 ) * n。 因 而 不 变 式 中 的 一 部 分 可 以 是 

fact = (count: + 1) + (count + 2) we .. * (nm = 1).* 2 
但 我 们 还 必须 保证 count 总 是 非 负 的 。 我 们 可 以 将 这 个 条 件 与 上 面 的 部 分 相 加 ， 从 而 得 到 

I = (fact = (count + 1) * .. . * n) AND (count >= 0) 

接 下 来 ， 必 须 检 查 I 是 否 符合 不 变 式 的 要 求 。 我 们 再 一 次 将 I 作为 P 来 使 用 ， 因 此 P 显 然 也 就 
缠 涵 了 I。 下 面 的 一 个 问题 是 

{I and B} S {I} 

Iand B 
为 

((fact = (count + 1) * . . . * n) AND (count >= 0)) AND 

(count <> 0) 

约 减 为 

(fact = (count + 1) * . . =. * Nn) AND (count > 0) 
在 这 种 情形 中 ， 我 们 必须 用 后 置 条 件 的 不 变 式 来 计算 循环 体 的 前 置 条 件 。 对 于 

{P} count = count - 1 {I} 
我 们 计算 了 为 

{(fact = count * (count + 1) * ...* n) AND 

(count >= 1)} 


使 用 上 述 公式 作为 循环 体 中 第 一 条 赋值 语句 的 后 置 条 件 ， 


{P} fact = fact * count {(fact = count * (count + 1) 


* . « e * n) AND (count >= 1)} 
在 这 种 情况 下 了 为 
{(fact = (count + 1) * . e > * n) AND (count >= 1)} 
WA, I and B 强 涵 着 P。 由 此 后 果 规 则 ， 
{I AND B} S {1} 


为 真 。I 的 最 后 一 个 测试 是 

I AND (NOT B) => Q 
在 我 们 的 例子 中 ， 这 是 

((fact = (count + 1) * 。。 . * n) AND (count >= 0)) AND 

(count = 0)) => fact = n! 

这 显然 为 真 ， 因 为 当 count = 0 时 ,第 一 部 分 正好 是 阶乘 的 定义 。 所 以 我 们 选择 的 I 满足 循环 
不 变 式 的 要 求 。 现 在 我 们 能 够 使 用 从 while 语 句 里 得 到 的 P (相同 于 工 ) 作为 程序 中 第 三 条 赋值 
语句 的 后 置 条 件 Ñ 


{P} fact = 1 {(fact = (count + 1) * . .. * n) AND 
(count >= 0) } 


由 此 而 产生 P 
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(1 = (count + 1) * . . . * n) AND (count >= 0)) 
将 此 用 作 下 列 代 码 中 第 一 条 赋值 语句 的 后 置 条 件 
{P} count = n {(1 = (count + 1) * a ^% * n) AND 
(count >= 0)) } 
产生 了 为 


人 


AND 操 作 符 左 边 的 操作 数 为 真 (因为 1 = 1) ， 并 且 其 右边 的 操作 数 恰恰 是 整个 程序 段 的 前 置 条 件 
{n >= 0}， 因 此 这 个 程序 被 证 明 是 正确 的 。 

3.5.2.8 评估 

在 运用 公理 方法 定义 一 种 完整 程序 设计 语言 的 语义 时 ， 对 于 语言 中 每 一 种 语句 类 型 ， 都 必 
须 给 出 公理 或 推理 规则 的 定义 。 事 实证 明 ， 对 程序 设计 语言 中 某 些 语句 定义 公理 与 推理 规则 是 
一 项 艰难 的 工作 。 对 于 这 个 问题 的 一 种 显而易见 的 解决 办 法 就 是 在 设计 语言 时 就 考虑 公理 。 这 
样 ， 这 种 语言 仅仅 包括 能 够 为 之 书写 公理 或 推理 规则 的 语句 。 然 而 不 和 位 的 是 ， 在 公理 语义 学 科 
的 现状 下 ， 这 样 的 一 种 语言 会 相当 短小 和 简陋 。 

公理 语义 是 程序 正确 性 证 明 研 究 中 的 一 种 有 力 工具 ， 在 程序 开发 及 其 后 的 阶段 ， 它 为 对 程 
序 进行 推理 的 工作 提供 了 一 个 完美 的 构架 。 然 而 ， 仅 仅 就 语言 使 用 人 员 或 编译 如 的 编写 人 员 将 
这 种 方法 用 于 描述 程序 设计 语言 的 意义 方面 ， 它 的 用 途 却 非常 有 限 。 


3.5.3 指称 语义 


指称 语义 是 众所周知 最 严格 的 描述 程序 意义 的 方法 。 这 种 方法 坚实 地 基于 递归 函数 的 理论 ，。 
对 于 使 用 指称 语义 来 描述 程序 设计 语言 语义 的 完整 讨论 将 会 很 长 也 很 复杂 。 因 而 我 们 在 这 里 介 
绍 的 内 容 只 是 使 读者 了 解 指称 语义 是 如 何 工 作 的 。 


. * n = 1) AND (n >= 0)} 


指称 语义 的 基本 概念 是 要 为 每 一 个 语言 实体 定义 一 Sere 
个 数学 对 象 以 及 一 个 映射 函数 ， 这 种 映射 函数 将 语言 实 人 们 进行 了 大 量 的 工作 ， 有 用 
体 的 实例 映射 到 数学 对 象 的 实例 上 。 因 为 数学 对 象 是 严 以 研究 使 用 指称 语言 的 描述 来自 


格 定义 的 ， 它 们 就 代表 了 相对 应 的 程序 实体 的 准确 意义 。 
这 种 思想 是 基于 这 样 的 事实 : 我 们 已 有 操纵 数学 对 象 的 
严格 方法 ， 但 还 没有 类 似 的 严格 方式 来 操纵 程序 设计 语 
言 中 的 结构 。 运 用 指称 语义 的 困难 之 处 在 于 构造 数学 对 
象 以 及 映射 函数 。 这 种 方法 之 所 以 被 称 为 “指称 ”语义 
方法 ， 是 因为 其 中 的 每 一 个 数学 对 象 指称 了 与 其 对 应 的 
语法 实体 的 含义。 
3.5.3.1 两 个 简单 例子 
我 们 使 用 一 种 非常 向 单 的 语言 结构 ， 即 二 进 制 数 ， 
来 介绍 指称 方法 。 下 面 的 文法 规则 用 来 描述 二 进 制 数 的 
语法 : 
< 二 进 制 数 > 一 0 
hi 
| < 二 进 制 数 > 0 
| < 二 进 制 数 > 1 
图 3-9 显 示 了 二 进 制 数 1 10 的 语法 分 析 树 。 


动产 生 编 译 器 的 可 能 性 (Jones， 
1980; Milos et al., 1984; Bodwin 
et al., 1982), RHA CHEW 
了 这 种 万 法 的 可 行 性 ， 但 这 方面 
的 工作 还 没有 进展 到 能 够 产生 实 
用 编译 器 的 程度 。 


< 二 进 制 数 > 


< 二 进 制 数 > we 


< 二 进 制 数 > io Re 


图 3-9 二 进 制 数 1 1 0 的 语法 分 析 树 
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为 了 使 用 指称 语义 及 上 述 例子 中 的 文法 规则 来 描述 二 进 制 数 的 意义 ， 我 们 将 实际 意义 与 每 
一 条 规则 联系 起 来 ， 这 些 规则 都 以 单个 终结 符 作 为 它 的 RHS。 在 这 个 情形 中 的 数学 对 象 是 简单 
的 十 进 制 数 。 因 此 ， 这 个 例子 中 的 二 进 制 数 的 意义 将 是 与 它 相 等 的 十 进 制 数 。 

在 我 们 的 例子 中 ， 有 意义 的 对 象 必须 与 前 面 两 条 文法 规则 相关 联 。 后 面 的 两 条 文法 规则 在 
未 种 意义 上 是 计算 规则 ， 因 为 它们 将 一 个 与 对 象 相 关联 的 终结 符 与 一 个 可 以 代表 某 种 结构 的 非 
余 结 符 结 合 起 来 。 假 设 有 一 种 在 语法 分 析 树 上 往 上 进行 的 运算 ， 其 右边 的 非 终 结 符 已 经 被 赋予 
了 意义 ， 那 么 语法 规则 会 需要 一 个 函数 来 计算 LHS 的 意义 。 这 个 LHS 的 意义 必须 能 够 代表 这 条 
规则 中 整个 RHS 的 意义 。 

假设 对 象 语义 值 的 范围 为 8， 它 是 一 个 非 负 的 十 进 制 整 数值 的 集合 。 我 们 正 是 希望 将 这 样 
的 对 象 与 二 进 制 数 相 关联 。 如 在 前 面 的 文法 规则 中 所 描述 的 ， 一 个 命名 为 M,,, 的 语义 函数 将 语 
法 对 象 映 射 到 N 中 的 对 象 上 。 国 数 Mein 的 定义 如 下 |; 


Mbin ( "i ) = 9 
Min ('1") = 1 
Moin (< 二 进 制 数 >'0') = 2 * Muia (< 二 进 制 数 > ) 6 一 进 制 数 > 


Mbin (< 二 进 制 数 >'1') = 2 * Min (< 二 进 制 数 >) + 1 


注意 ， 我 们 用 单 引 号 来 包括 语法 中 的 数字 ， 以 表 
示 它 们 与 数学 数字 的 区 别 。 这 两 种 数字 之 间 的 关系 ee 
类 似 于 ASCII 码 数字 与 数学 数字 的 关系 。 当 程序 读 人 入 
一 个 表示 为 字符 串 的 数字 时 ， 程 序 在 将 它 作为 数字 1< 一 进 制 数 > 
使 用 之 前 ， 必 须 将 它 转换 成 数学 数字 | 
可 以 将 意义 或 者 标志 对 象 (在 这 个 例子 中 是 十 进 l 
制 数 ) 附加 到 上 面 的 语法 分 析 树 的 节点 上 ， 产 生 图 3-10 
中 的 树 。 这 就 是 语法 指导 的 语义 。 语 法 实体 被 映射 TO 共有 11 0 的 指称 对 象 的 语法 分 析 树 
到 具有 具体 意义 的 数学 对 象 之 上 。 
因为 我 们 将 来 还 会 用 到 ， 所 以 下 面 给 出 一 个 描述 语法 十 进 制 字面 常量 意义 的 例子 
< 
| < 十 进 制 数 > ('0' [ta | 2) 
对 于 这 些 语法 规则 的 指称 映射 是 
Sd Meg 
Mace ( < 十 进 制 数 > "0' ) = 10 * Mes ( < 十 进 制 数 > ) 
Mace ( < 十 进 制 数 > '1' +) = 10 * Mae ( < 十 进 制 数 > ) + 1 


Maco ( < 十 进 制 数 > ye ) = 10 a Maec ( < 十 进 制 数 > ) ae 


在 下 面 的 几 闻 里 ， 我 们 将 给 出 一 些 简单 结构 的 指称 语义 。 这 里 所 做 的 最 重要 的 简单 假定 是 
假设 结构 的 语法 以 及 静态 语义 都 是 正确 的 。 除 此 以 外 ， 我 们 规定 只 包括 两 种 标量 类 型 ， 即 整 型 
与 布尔 型 。 

3.5.3.2 程序 的 状态 

可 以 用 一 人 台 理 想 计 算 机 上 的 状态 变化 来 定义 程序 的 指称 语义 。 操 作 语义 是 以 这 种 方式 来 定 
艾 的 ， 指 称 语义 几乎 也 可 以 这 样 。 然 而 在 作 进一步 的 简化 以 后 ， 可 以 仅仅 使 用 程序 中 所 有 恋 量 
的 值 来 进行 定义 。 操 作 语 义 与 指称 语义 之 间 的 关键 区 别 在 于 ， 操 作 语义 中 的 状态 变化 由 用 划 种 
在 序 设计 语言 编写 的 代码 算法 来 定义 ， 而 指称 语义 中 的 状态 变化 则 由 严格 的 数学 函数 来 定义 


假设 一 个 程序 的 状态 s 由 下 面 一 组 有 顺序 的 对 来 代表 : 

lein Wy Shp, Wary oe aye Edgy Vi} 

i 是 一 个 变量 名 ， 而 与 之 相关 的 Vv 是 这 个 变量 的 当前 值 。 这 些 v 中 的 任意 一 个 都 可 以 具有 特殊 值 
undef， 它 指示 与 这 个 v 相 关联 的 变量 目前 无 定义 。 假 设 YARMRAP 为 一 个 具有 两 个 参数 的 国 数 ， 
其 中 的 一 个 参数 是 变量 名 ， 男 一 个 参数 是 程序 状态 。VARMAP (iivs ) 的 值 为 wj (在 s 状 态 下 与 i 
相配 对 的 值 )。 大 多 数 用 于 程序 和 程序 结构 的 语义 映射 函数 都 在 不 同 的 状态 之 间 进 行 映 射 。 这 些 
状态 变化 就 被 用 来 定义 程序 以 及 程序 结构 的 意义 。 有 一 些 语言 结构 (如 表达 式 ) 是 被 映射 到 数 
值 而 不 是 状态 。 

3.5.3.3 表达 式 

对 于 大 多 数 程序 设计 语言 ， 表 达 式 是 基本 的 结构 。 我 们 在 此 假设 表达 式 没 有 副作用 。 另 外 ， 
我 们 只 处 理 非 常 简单 的 表达 式 : 它们 仅仅 包括 + 和 * 操作 符 ， 并 且 一 个 表达 式 最 多 只 能 够 有 一 
个 操作 符 ， 在 这 里 仅 有 的 操作 数 是 标量 变量 和 整数 字面 常量 ， 没 有 括号 ， 而 且 表 达 式 的 值 是 整 
数 。 下 面 是 这 些 表达 式 的 BNF 描述 : 

< 表达 式 > 一 < 十 进 制 数 > | < 变量 > | < 二 元 表达 式 > 

< 二 元 表达 式 > 一 < 左边 表达 式 > < 操作 符 > < 右边 表达 式 > 
左边 表达 式 > > < 十 进 制 数 > | < 变量 > 
右边 表达 式 > 一 < 十 进 制 数 > | < 变量 > 
操作 符 > 一 二 | * 

在 表达 式 中 我 们 所 要 考虑 的 唯一 错误 是 变量 具有 无 定义 的 值 。 其 他 的 错误 当然 也 可 能 出 现 ， 
但 是 大 部 分 的 错误 与 机 器 相关 。 设 2 为 一 个 整数 集合 ， 并 且 设 erroz 为 错误 值 。 那 么 zU 
{error} 就 是 表达 式 计 算 结 果 值 的 集合 。 

对 于 给 定 表达 式 E 和 状态 s， 我 们 可 以 给 出 所 需要 的 映射 函数 如 下 。 为 了 区 别 数 学 函数 的 定义 
与 程序 设计 语言 中 的 赋值 语句 ， 我 们 使 用 符号 A = 来 定义 数学 函数 。 下 面 定义 中 的 蕴涵 符号 => 
将 一 个 操作 数 的 形式 和 与 它 相 关 的 case( 或 者 switch) 相连 接 。 点 的 标记 “.” 用 来 表示 一 个 结 点 
的 子 结 点 。 例 如 ，< 二 元 表达 式 >.< 左边 表达 式 > 表示 的 是 < 二 元 表达 式 > 的 左 子 结 点 。 

M.( < 表达 式 >, s ) A= 

case < 表达 式 > of 

< 十 进 制 数 > => Mal < 十 进 制 数 >, s ) 
< 变量 > => if VARMAP( < 变量 >，s ) == undef 
then error 
else VARMAP( < 变量 >, s ) 
< 二 元 表达 式 > => 


A A ‘AA 


if ( M。( < 二 元 表达 式 >.< 左边 表达 式 >, s ) == undef OR 
M。( < 二 元 表达 式 >.< 右边 表达 式 >, s ) == undef ) 
then error 
else if ( < 二 元 表达 式 >.< 操 作 符 > ==“ + ”)then 


M。( < 二 元 表达 式 > .< 左边 表达 式 >, s ) + 
M。( < 二 元 表达 式 >.< 右边 表达 式 >, s ) 
else M。( < 二 元 表达 式 >.< 左边 表达 式 >, s ) * 
M。( < 二 元 表达 式 >.< 右边 表达 式 >, 8 ) 
3.5.3.4 赋值 语 和 名 
赋值 语句 是 一 个 表达 式 的 求 值 ， 可 以 将 赋值 语句 左边 变量 的 值 设 定 为 表达 式 的 值 。 在 这 种 
情况 下 ， 意 义 函 数 在 状态 之 间 进 行 映射 。 这 个 函数 可 以 被 描述 如 下 : 
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M(x = E, s) A= if M.(E, s) == error 
then error 
, 
else s’ = {<i;’, v>, <i)’, V7 >, ... » <in > Vn >}, Where 
for j=l, Arep 


if i; == X 


then vi = M., s) 
else v; = VARMAP(i,, s) 
请 注意 ， 在 上 面倒 数 第 三 行 的 比较 ，i; == x， 是 名 字 的 比较 而 非 数值 的 比较 。 
3.5.3.5 逻辑 先 测试 循环 
一 个 简单 逻辑 循环 的 指称 语义 简单 得 让 人 迷惑 。 为 了 方便 讨论 ， 我 们 假设 存在 男 外 两 个 已 
有 的 映射 国 数 Ms 和 Mb， 它 们 分 别 将 语句 列表 映射 到 状态 ， 并 将 布尔 表达 式 映 射 到 布尔 值 (或 者 
是 error) ZE. KP RRA 
M,(while B do L, s) A= if M,(B, s) == undef 
then error 
else if M,(B, s) == false 
then s 
else if M,(L, s) == error — 


then error 
else M,(while B do L, M,(L, s)) 


这 个 循环 的 意义 仅仅 是 ， 如 果 没 有 出 现 错误 ， 循 环 中 的 语句 被 执行 规定 的 次 数 之 后 程序 中 
的 变量 所 取 的 值 。 在 实质 上 ， 已 经 将 这 个 循环 从 迭代 转换 成 为 递归 ， 这 里 递归 控制 的 数学 定 
义 取 目 其 他 的 递归 状态 映射 函数 。 较 之 迭代 ， 递 归 更 容易 从 数学 上 严格 地 描述 。 到 此 为 止 的 
一 个 重大 发 现 是 ， 上 面 的 这 个 定义 就 像 实际 程序 中 的 循环 一 样 ， 可 能 因为 非 终 止 性 而 不 进行 
任何 计算 。 

3.5.3.6 评估 

正如 在 上 面 讨论 中 所 使 用 的 那些 对 象 与 函数 一 样 ， 我 们 也 可 以 为 程序 设计 语言 的 其 他 语法 
实体 来 定义 对 象 与 函数 。 当 对 给 定语 言 定义 了 一 套 完整 的 系统 时 ， 就 能 够 使 用 这 个 系统 来 决定 
这 种 语言 中 完整 程序 的 意义 。 这 给 运用 高 度 严格 的 方式 进行 程序 设计 的 思维 提供 了 框架 。 

旧称 语义 能 够 辅助 语言 的 设计 。 例 如 ， 如 果 一 条 语句 的 指称 语义 描述 既 困 难 又 复杂 ， 这 就 
告诉 了 设计 人 员 ， 未 来 的 用 户 们 也 会 难于 理解 这 样 的 语句 ， 因 而 应 该 转 而 使 用 其 他 可 能 的 设计 。 

由 于 指称 擅 述 的 复杂 性 ， 它 们 对 语言 的 使 用 人 员 几 乎 没有 用 处 。 但 在 另 一 方面 ， 它 们 提供 
了 一 种 精确 摘 述 语言 的 优异 方法 。 

虽然 通常 将 指称 语义 的 使 用 归功 于 Scott 和 Strachey 两 人 (Scott and Strachey，1971) ， 但 是 
天 于 语言 摘 述 的 一 般 标志 方式 ， 却 一 直 能 够 追溯 到 19 世 纪 (Frege, 1892) 。 


小 结 


巴 科 斯 一 诺尔 范式 和 与 上 下 文 无 关 文法 是 等 价 的 元 语言 , 它们 能 够 近 平 理想 地 描述 程序 设计 语言 语法 。 
这 不 仅 在 于 它们 独特 的 人 简明 描述 方法 ， 它 们 所 具备 的 与 分 析 操 作 相 关联 的 语法 分 析 树 提供 了 语法 结构 的 图 
形 表示 。 此 外 ， 它 们 还 与 识别 它们 所 产生 的 语言 的 装置 自然 相关 ， 这 使 得 构造 这 些 语言 编译 器 的 语法 分 析 
ft FART AE DD o 

属性 文法 是 一 种 描述 形式 ， 它 能 够 描述 语言 的 语法 以 及 静态 语义 。 属 性 文法 是 与 上 下 文 无 关 文 法 的 
一 种 扩展 。 一 个 属性 文法 包括 一 个 文法 、 一 组 属性 、 一 组 属性 计算 函数 以 及 一 组 描述 静态 语义 的 谓词 。 

主要 有 三 种 描述 语义 的 方法 : 操作 、 公 理 与 指称 。 操 作 语 义 是 以 语言 结构 在 一 部 理想 机 器 上 的 效应 
来 摘 述 语言 意义 的 方法 。 基 于 形式 逻辑 的 公理 语义 被 设计 为 求证 程序 正确 性 的 一 种 工具 。 指 称 语义 则 使 用 
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数学 对 象 来 代表 语言 结构 的 意义 。 语 言 实 体 通过 递归 函数 被 转换 成 为 数学 对 象 。 


文献 注释 


关于 使 用 与 上 下 文 无 关 文 法 以 及 BNF 的 语法 描述 ， 在 Cleaveland 和 Uzgalis 的 书 中 进行 了 透彻 的 讨论 
(Cleaveland and Uzgalis, 1976 ) 。 
公理 语义 的 研究 始 于 Floyd (1967)， 并 由 Hoare 给 予 更 进一步 的 发 展 (Hoare, 1969)。Hoare 和 Wirth 运 
用 这 种 方法 描述 了 Pascal 语 言 中 的 大 部 分 语义 (Hoare and Wirth, 1973) 。 还 没有 完成 描述 的 部 分 涉及 了 图 
数 的 副作用 以 及 goto 语 句 。 这 被 公认 为 是 最 难 描述 的 。 161 
Dijkstra 描 述 (和 推荐 ) 了 在 程序 的 开发 中 运用 前 置 条 件 与 后 置 条 件 的 技术 (Dijkstra, 1976) ， 后 来 ， 
Gries 又 对 此 进行 了 更 为 详细 的 讨论 (Gries, 1981), 
关于 指称 语义 较 好 的 介绍 ， 能 够 在 Gordon (1979) 和 Stoy (1977) 的 文章 中 找到 。 关 于 本 章 所 讨论 的 
三 种 语义 描述 方法 的 介绍 ， 也 能 够 在 Marcotty et al. (1976) 的 文章 中 读 到 。 关 于 本 章 许 多 内 容 的 另 一 个 较 
好 的 参考 书 为 (Pagan, 1981)。 本 章 中 指称 语义 函数 的 形式 与 Meyer (1990) 论文 中 的 相 类 似 。 


复习 题 


1. 给 出 语法 和 语义 的 定义 。 
2. 语言 描述 是 为 什么 人 设计 的 ? 
3. 描述 一 般 语 言 生成 器 的 运作 。 
4. 描述 一 般 语 言 识别 器 的 运作 。 
5. 语句 与 句 型 之 间 有 什么 区 别 ? 
6. 定义 一 条 左 递归 文法 规则 。 
7. 在 大 多 数 的 EBNF 之 中 ， 哪 三 个 扩展 是 最 常用 的 ? 
8. 区别 静态 语义 和 动态 语义 之 差别 。 

9. 谓词 在 属性 文法 中 起 什么 作用 ? 

10. 合成 属性 和 继承 属性 之 间 有 什么 不 同 ? 

11. 对 于 给 定 的 属性 文法 树 ， 属 性 求 值 的 顺序 是 怎样 决定 的 ? 

12. 属性 文法 的 主要 应 用 是 什么 ? 

13. 使 用 软件 纯 解释 器 来 作为 操作 语义 ， 存 在 着 什么 样 的 问题 ? 

14. 请 解释 ， 给 定语 句 的 前 置 条 件 与 后 置 条 件 在 公理 语义 中 的 意义 是 什么 。 

15. 描述 使 用 公理 语义 证 明 给 定 程序 正确 性 的 方式 。 

16. 描述 指称 语义 的 基本 概念 。 

17. 操作 语义 与 指称 语义 在 基本 方式 上 有 什么 不 同 ? 162 


练习 题 


.语言 摘 述 的 两 种 数学 模型 是 生成 与 识别 。 请 分 别 描述 它们 是 怎样 定义 程序 设计 语言 的 语法 的 。 
. 写 出 下 列 各 项 的 EBNE 摘 述 : 
a. Java 语 言 类 定义 的 一 条 头 语句 。 
b. Java 语 言 的 方法 调用 语句 。 
c.C 语 言 的 一 条 Switch 语句 。 
d.C 语 言 的 一 条 union 定 义 。 
e.C 语 言 的 float 字 面 常 量 。 
.改写 例 3.4 中 的 BNF， 使 得 + 的 优先 级 高 于 * ， 并 且 强 制 + 为 右 结 合 的 。 
.改写 例 3.4 中 的 BNF， 使 其 包括 Java 中 的 ++ 以 及 -- 一 元 操作 符 。 


No “天 


A w 


J: 
6. 


T: 


8. 


— 
p< 


14. 
.将 例 3.1 中 的 BNEF 转 换 为 EBNF。 


15 


110 


为 Java 的 表达 式 写 出 BNF 的 描述 ， 其 中 包括 这 样 三 个 操作 符 : &&, 和! ， 还 包括 关系 表达 式 。 


运用 例 3.2 中 的 文法 为 下 面 每 一 条 语句 构造 语法 分 析 树 和 最 左派 生 : 


aA = A Bt (C * Ay) 
b.B =C» (A * C +B) 
c.A = A * (B+ (C)) 


运用 例 3.4 中 的 文法 ， 为 下 面 每 一 条 语句 构造 语法 分 析 树 和 最 左派 生 : 
aA=(A+t+tB)*C 

b.A B+ ¢C + A 

C.A =A * (B + C) 

d.A = B * (C * (A + B)) 

证 明 下 面 的 文法 是 歧义 性 的 : 

<S>- <A> 

<A>—> <A>+<A>1< frit > 

< 标识 符 > 一 alblc 


:修改 例 3.4 中 的 文法 ， 增 加 一 个 一 元 减法 操作 符 ， 并 使 它 的 优先 级 高 于 + 或 * 操作 符 。 
.用 次 语 描述 下 列 文法 所 定义 的 语言 : 


15> > <A>< BS <C> 
<A>—a<A>la 
<B>—-b< 5B > l'b 
<Cre—¢<C le 


. 考虑 下 列 文法 : 


<S>—<A>a<B>b 

<A>—<A>blb 

<B>—a<B>la 

下 面 的 哪些 句子 属于 这 些 文法 所 产生 的 语言 ? 
a. baab 

b. bbbab 

c. bbaaaaa 

d. bbaab 


.考虑 下 列 文法 : 


<S>—a<S>c<B>/I<A>Ib 

<A>—¢ <ASle 

<B>—-dl<A> 

下 面 的 哪些 句子 属于 这 些 文法 所 产生 的 语言 ? 
a. abcd 

b. acccbd 

c. acccbcc 

d. acd 


€. accc 


.为 一 种 由 字符 串 构 成 的 语言 编写 文法 ， 这 个 字符 串 包括 字母 a 的 n 次 复制 ， 后 面 接着 字母 b 的 相同 次 数 
的 复制 ，n> 0。 例 如 ， 字 符 串 ab、aaaabbbb 和 aaaaaaaabbbbbbbb 是 属于 这 种 语言 ， 但 是 字符 串 a、 


abb、ba 和 aaabb 则 不 在 这 种 语言 之 中 。 
为 句子 aabb 和 aaaabbbb 画 出 由 练习 题 13 中 的 文法 所 派生 的 语法 分 析 树 。 


16. 将 例 3.3 中 的 BNF 转 换 为 EBNF， 
17. 将 下 面 的 EBNF 转 换 为 BNF: 
S—A4{bA} 
A—af[b]A 
18. 运用 3.5.1.1 市 中 的 虚拟 机 器 指令 ， 给 出 下 面 结构 的 操作 语义 定义 : 
a. Java 语 言 的 do-while 
b. Ada 语 言 的 for 
c. Fortran 语 言 如 下 形式 的 Do 语句 : Do N K = start, end, step 
d. Pascal 语 言 的 1]f-then-else 
e.C 语言 的 for 
f. C 语言 的 switch 
19. 对 于 下 面 列 出 的 每 一 条 赋值 语句 及 其 后 置 条 件 ， 计 算 最 弱 前 置 条 件 : 
a.a=2* (b - 1) - 1{a > 0} 
b.b = (c + 10) / 3{b > 6} 
ca=at+t+t2* b —- lfa> 1} 


d.x=2* y +x = 1{x > 11 
20. 对 于 下 面 列 出 的 每 一 系列 赋值 语句 及 其 后 置 条 件 ， 计 算 最 弱 前 置 条 件 : 


a.a2= 2* b+ 1: 
b=a - 3 
{b < 0} 


ba=3%* (2 * b+ a); 
b=2* a-1 
{b > 5} 
: 为 下 列 的 各 条 语句 写 出 指称 语义 的 映射 函数 : 
a.Ada 语 言 的 for 
b. Java 话 言 的 dao-while 
c. Java 语 言 的 布尔 表达 式 
d. Java 语 言 的 for 
e. Ci 语 言 的 switch 
22. 内 在 属性 与 非 内 在 合成 属性 之 间 的 差别 是 什么 ? 
23. 写 出 一 个 属性 文法 ， 它 的 BNF 基 础 是 3.4.5 节 中 的 例 3.6， 而 它 的 语言 规则 如 下 ， 在 表达 式 中 不 能 够 混合 
数据 类 型 ， 但 是 不 要 求 赋值 语句 中 赋值 操作 符 的 两 边 为 相同 类 型 。 
24. 写 出 一 个 属性 文法 ， 它 的 BNF 基 础 是 例 3.2， 它 的 类 型 规则 与 第 3.4.5 小 节 中 赋值 语句 的 例子 相同 。 
25. 证 明 下 面 程序 的 正确 性 : 
{n > 0} 
count = n; 
sum = 0; 
while count <> 0 do 
sum = sum + count; 
count = count - 1; 


2 


—" 


end 
{sum = 1 + 2 + = + n} 


BAS ”词法 分 析 和 语法 分 析 


要 认真 研究 编译 器 的 设计 , -至 少 需要 一 个 学 期 的 时 间 来 集中 学 习 ， 包 括 设计 和 实现 一 种 实 
际 的 小 程序 设计 语言 的 编译 器 。 这 样 一 门 课程 的 第 一 部 分 就 是 词法 和 语法 分 析 。 语 法 分 析 器 是 
编译 占 的 核心 ， 因 为 其 他 的 一 些 重 要 组 件 ， 包 括 语 义 分 析 器 和 中 间 代 码 产生 器 都 是 由 语法 分 析 
as ZN TEA RSNA) 

有 些 读者 可 能 会 疑惑 : 为 什么 包含 编译 器 所 有 部 分 的 一 章 会 放 入 讲述 程序 设计 语言 的 书 中 。 
在 本 书 中 包含 对 词法 分 析 和 语法 分 析 的 讨论 至 少 有 两 个 原因 : 首先 ， 语 法 分 析 直 接 基 于 第 3 章 中 
讨论 过 的 文法 ， 因 此 把 它们 作为 文法 的 一 个 应 用 进行 讨论 就 是 理所当然 的 。 其 次 ， 词 法 分 析 器 
和 语法 分 析 器 在 编译 器 设计 中 占有 重要 的 地 位 。 许 多 应 用 程序 ， 包 括 程序 列表 格式 化 器 、 计 算 
程序 复杂 度 的 程序 以 及 分 析 和 响应 配置 文件 内 容 的 程序 ， 它 们 需要 做 的 就 是 词法 分 析 和 语法 分 
析 。 因 此 ， 对 于 软件 开发 人 员 来 说 ， 词 法 分 析 和 语法 分 析 是 很 重要 的 主题 ， 即 使 他 们 不 需要 编 
写 一 个 编译 器 。 而 且 ， 一 些 计算 机 科学 专业 不 再 要 求学 生 完成 编译 器 设计 课程 ， 这 会 让 学 生 缺 
之 间 语 分 析 和 语法 分 析 的 知识 。 在 上 述 情况 下 ， 可 以 将 本 章 纳 入 程序 设计 语言 课程 。 如 果 设 置 
了 相关 的 编译 器 设计 课程 ， 则 可 以 跳 过 本 章 。 

本 章 从 词法 分 析 的 介绍 开始 ， 包 括 了 一 个 简单 的 例子 ， 然 后 讨论 语法 分 析 的 一 般 问题 ， 包 
括 语 法 分 析 的 两 种 主要 方式 以 及 语法 分 析 的 复杂 性 ， 接 着 我 们 介绍 自 顶 向 下 语法 分 析 器 的 递归 
TARAA, 包括 两 个 递归 下 降 语 法 分 析 器 的 例子 。 最 后 一 节 讨 论 自 底 向 上 语法 分 析 和 LR 语 

法 分 析 算 法 。 这 一 E T O 以 及 使 用 LR 语法 分 析 过 程 对 字 
符 串 的 语法 进行 分 析 。 


4.1 概述 


我 们 曾经 在 第 1 章 里 介绍 了 实现 程序 设计 语言 的 三 种 不 同方 式 ;， 编译 、 单 纯 解释 以 及 混合 实 
现 。 编 译 古 使 用 被 称 为 编译 器 的 一 种 翻译 程序 ， 将 用 高 级 语言 编写 的 程序 翻译 成 机 器 码 。 一 般 
采用 编译 技术 来 实现 适合 大 型 应 用 的 程序 设计 语言 ， 这 些 应 用 通常 由 类 似 C++ 或 COBOL 等 语言 
编写 。 单 纯 解释 系统 不 采用 翻译 程序 ， 而 是 由 软件 解释 器 来 对 程序 的 原 有 形式 进行 解释 ， 单纯 
解释 通常 被 用 于 较 小 型 的 系统 ， 这 种 系统 对 执行 效率 的 要 求 并 不 高 ， 例 如 ， 在 HTML 文 档 中 笛 
入 由 JavaScript 编 写 的 脚本 。 混 合 实现 系统 将 高 级 语言 编写 的 程序 翻译 成 为 中 间 形 式 ， 然 后 对 这 
种 中 间 形 式 进行 解释 。 如 今 ， 这 种 类 型 的 系统 得 到 了 比 以 往 任 何 时 候 都 更 为 广泛 的 应 用 ， 主 要 
应 归功 于 Java 以 及 Perl 语 言 被 广泛 接受 。 从 传统 意义 考虑 ， 混合 系统 将 导致 比 编译 系统 慢 得 多 的 
程序 执行 速度 。 然 而 近年 来 ， Just-In-Time (JIT) 编译 器 的 使 用 开始 盛行 ， 尤 其 在 Java 程 序 上 的 
运用 。JIT 编 译 器 将 中 间 代 码 翻 译 成 机 器 码 ， 当 第 一 次 调用 一 个 方法 时 ，JIT 编 译 器 将 对 这 个 方 
法 进行 翻译 。 从 实际 效果 上 看 ，JIT 编 译 器 将 一 个 混合 系统 转换 成 为 一 个 延迟 的 编译 系统 。 

语法 分 析 器 (Syntax analyzer 或 parser) 几乎 总 是 基于 一 种 对 程序 语法 的 形式 描述 。 最 普遍 
应 用 的 语法 描述 形式 是 曾 经 在 第 3 章 里 介绍 过 的 上 下 文 无 关 文 法 ， 即 BNF。 相 对 于 某 些 非 形式 的 
语法 描述 ， 使 用 BNF 至 少 具有 三 个 吸引 人 的 优点 : 首先 ，BNF 程 序 语法 的 描述 ， 无 论 是 对 于 人 
还 古 对 于 使 用 它们 的 软件 系统 ， 都 十 分 清晰 与 精确 ， 其 次 ， 能 够 将 BNF 的 描述 作为 语法 分 析 器 


二 
的 基础 ， 最 后 ， 因 为 有 清晰 的 模块 化 结构 ， 基 于 BNF 来 实现 的 系统 相对 容易 维护 。 

几乎 所 有 编译 器 都 将 分 析 语法 的 任务 分 成 两 个 分 离 的 部 分 ， 即 词法 分 析 和 语法 分 析 ， 虽 然 
这 样 的 术语 容易 让 人 混淆 。 简 言 之 ， 词 法 分 析 处 理 小 规模 的 语言 结构 ， 如 名 字 和 数字 的 字面 党 
量 。 语 法 分 析 处 理 大 规模 的 结构 ， 如 表达 式 、 语 句 以 及 程序 单元 。 我 们 将 在 第 4.2 节 介绍 词法 分 
析 ， 在 4.3 节 、4.4 节 和 4.5 节 讨论 语法 分 析 。 

下 面 叙述 一 些 理由 ， 用 以 说 明 为 什么 要 将 词法 分 析 从 语法 分 析 中 分 离开 来 。 

1. 简单 性 。 词 法 分 析 需 要 的 技术 比 语法 分 析 较 简单 ， 因 而 如 果 将 词法 分 析 从 语法 分 析 中 分 
离 出 来 ， 它 的 分 析 过 程 就 可 能 比较 简单 。 另 外 ， 将 词法 分 析 中 的 低层 次 细节 从 中 移出 来 之 后 ， 
语法 分 析 器 就 更 为 小 巧 而 简洁 。 

2. 效率 。 优 化 词法 分 析 器 会 获得 相当 的 回报 ， 因 为 词法 分 析 占用 总 编译 时 的 相当 一 个 部 
分 ， 然 而 优化 语法 分 析 器 则 没有 效果 。 分 离 这 两 种 分 析 器 有 助 于 选择 性 地 进行 优化 。 

3. 可 移植 性 。 因 为 词法 分 析 器 读 和 人 输入 的 程序 文件 ， 并 且 通 常 包括 了 输入 文件 的 缓冲 ， 它 
在 某 种 程度 上 依赖 于 平台 。 然 而 ， 语 法 分 析 器 则 可 以 是 独立 于 平台 的 。 将 软件 系统 中 依赖 于 机 
器 的 部 分 分 离开 来 ， 总 是 较为 明智 的 举动 。 


4.2 词法 分 析 


词法 分 析 器 实质 上 是 一 个 模式 匹配 器 。 模 式 匹 配器 总 是 试图 从 一 个 给 定 字符 串 中 找到 与 一 、[169 
个 给 定 的 字符 模式 相 匹配 的 子 串 。 模 式 匹 配 是 计算 科学 中 的 传统 部 分 。 最 早期 模式 匹配 的 一 个 
应 用 是 文本 编辑 器 ， 如 在 UNIX 早 期 版 本 中 引入 的 edq 行 编辑 器 。 从 那个 时 候 开 始 ， 模 式 匹 配 就 
进入 了 程序 设计 语言 ， 例 如 ， 它 存在 于 Perl 和 JavaScript 语 言 中 ， 在 Java，C++ 以 及 C# 的 标准 类 
库 中 也 存在 。 

可 以 将 词法 分 析 器 作为 语法 分 析 器 的 前 端 。 在 技术 上 ， 词 法 分 析 是 语法 分 析 的 一 个 组 成 部 
分 。 词 法 分 析 器 是 在 程序 结构 的 最 低层 进行 语法 分 析 。 一 段 输入 的 程序 对 于 编译 绢 而 言 就 像 是 
单个 的 字符 串 。 词 法 分 析 器 将 字符 编 人 逻辑 的 组 合 ， 并 根据 这 些 组 合 的 结构 赋 以 内 部 编码 。 这 
种 字符 组 合 称 为 词素 (lexeme) ， 而 这 种 组 合 种 类 的 内 部 编码 称 为 标记 (token)。 通 过 将 输入 的 
字符 串 与 字符 串 模 式 匹 配 的 方式 来 进行 词素 的 识别 。 尽 管 在 编码 中 ， 通 常 使 用 整数 值 作为 标记 ， 
为 了 词法 分 析 器 以 及 语法 分 析 器 的 可 读 性 ， 通 常 是 使 用 命名 常量 来 进行 3 用 。 

考虑 下 面 一 条 赋值 语句 的 例子 : 


result = oldsum — value / 100; 


下 面 分 别 是 这 条 语句 的 标记 与 词素 : 


标记 词素 
标识 符 result 
赋值 _ 操 作 符 = 
标识 符 oldsum 
减法 _ 操 作 符 - 
标识 符 value 
除法 _ 操 作 符 / 
整数 _ 限 制 100 
分 号 


词法 分 析 器 从 给 定 的 输入 字符 串 中 提取 词素 ， 并 产生 与 之 对 应 的 标记 。 在 早期 的 编译 器 中 ， 
词法 分 析 器 通常 处 理 整个 程序 文件 ， 从 而 产生 标记 与 词素 的 文件 。 然 而 现在 大 部 分 的 词法 分 析 
器 都 是 语法 分 析 器 的 子 程序 ， 它 们 从 输入 中 产生 下 一 个 词素 ， 还 产生 与 词素 相关 联 的 标记 代码 ， 
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并 将 这 些 代码 返回 给 调用 程序 一 一 即 语 法 分 析 器 。 语 法 分 析 器 唯一 能 够 看 到 的 输入 程序 就 是 自 
词法 分 析 器 产生 的 输出 ， 一 次 一 个 词素 。 

词法 分 析 的 过 程 包 括 了 跳 越 注 释 以 及 词素 之 外 的 空格 ， 因 为 它们 与 程序 的 意义 无 关 。 此 外 ， 
词法 分 析 器 将 用 户 定义 名 字 的 词素 插入 符号 表 ， 以 供 编译 器 在 后 面 阶段 使 用 。 最 后 ， 词 法 分 析 
短 将 找 出 标记 里 的 语法 错误 ， 例 如 有 错误 的 浮 点 字面 常量 ， 并 向 用 户 报告 这 种 错误 。 

构造 一 个 词法 分 析 器 有 三 种 方式 : , 

1. 使 用 与 正则 表达 式 ”有关 的 一 种 描述 性 语言 ， 写 出 语言 标记 模式 的 形式 描述 ， 并 使 用 软 
件 工具 自动 产生 词法 分 析 器 。 有 许多 这 种 用 途 的 工具 ， 其 中 最 古老 有 旦 最 容易 获得 的 是 lex， 它 通 
第 是 UNIX 系 统 的 一 部 分 。 

2. 设计 一 个 描述 语言 标记 模式 的 状态 转换 图 ， 并 编写 出 实现 这 种 状态 转换 图 的 程序 。 

3. 设计 一 个 瓜 述 语言 标记 模式 的 状态 转换 图 ， 并 手工 建造 一 个 这 种 状态 图 的 表格 驱动 式 
实现 。 
状态 转换 图 ， 或 简单 地 称 为 状态 图 ， 是 一 种 有 向 图 。 在 状态 图 的 节点 上 标 有 状态 的 名 字 ， 
而 在 状态 图 的 弧 线 上 则 标 有 3 引起 这 种 状态 转换 的 输入 字符 。 弧 线 也 可 以 包括 在 实行 这 种 转换 时 
词法 分 析 器 所 必须 采取 的 动作 。 

用 于 词法 分 析 器 的 这 种 状态 图 被 表示 成 称 为 有 限 自动 机 的 数学 机 器 的 类 。 可 以 设计 有 限 自 
动机 来 识别 一 类 被 称 为 正则 语言 的 语言 。 正 则 表达 式 和 正则 文法 是 正则 语言 的 生成 装置 。 程 序 
设计 语言 的 标记 就 是 一 种 正则 语言 ， 而 词法 分 析 器 则 是 一 台 有 限 自动 机 。 

我 们 现在 用 一 个 状态 图 及 实现 这 个 状态 图 的 代码 来 介绍 词法 分 析 器 的 构造 。 状 态 图 可 以 仅 
包括 每 一 个 标记 的 状态 及 其 状态 的 转换 ， 然 而 这 种 方式 将 产生 一 个 极为 庞大 和 复杂 的 图 形 ， 因 
此 必须 想 办 法 简化 。 

假设 ， 我 们 需要 一 个 词法 分 析 器 ， 它 仅仅 识别 程序 名 、 保 留 字 以 及 整数 字面 常量 。 在 这 个 
例子 中 ,名 字 由 包括 大 写字 母 、 小 写字 母 以 及 数字 的 字符 串 组 成 ， 但 是 必须 从 字母 开始 。 这 些 
名 字 没 有 长 度 限制 。 我 们 首先 观察 到 ， 可 以 使 用 52 个 不 同 的 字符 (英文 的 大 、 小 写字 母 ) 来 开 
始 一 个 名 字 ， 这 就 要 求 转换 图 的 初始 状态 具有 52 个 转换 。 然 而 ， 词 法 分 析 器 的 兴趣 仅仅 是 确定 
这 是 个 名 字 ， 并 不 关心 这 是 一 个 什么 样 的 特定 名 字 。 因 此 ， 我 们 为 这 52 个 英文 字母 定义 一 个 字 
符 类 LETTER， 在 任何 时 候 ， 只 对 名 字 的 第 一 个 字母 实施 单个 转换 。 

然后 我 们 观察 到 ， 名 字 以 及 保留 字 具 有 相 类 似 的 模式 。 虽 然 可 以 建立 一 个 状态 图 来 识别 一 
种 程序 设计 语言 中 的 每 个 特定 的 保留 字 ， 但 这 样 会 产生 一 个 很 大 的 状态 图 。 如 果 让 词法 分 析 器 
使 用 相同 的 模式 来 识别 名 字 和 保留 字 ， 然 后 再 通过 查询 保留 字 表 来 决定 哪些 名 字 为 保留 字 ， 这 
样 就 会 简单 快捷 得 多 。 使 用 这 种 方式 把 保留 字 作为 标记 种 类 的 例外 。 

向 化 转换 图 的 另外 一 种 可 能 方式 是 使 用 整数 字面 常量 的 标记 。 整 数字 面 常量 的 词素 可 以 使 用 
十 个 不 同 字符 来 作为 第 一 个 字符 ， 这 样 就 需要 十 个 状态 图 初始 态 的 转换 。 因 为 词法 分 析 器 并 不 关 
心 定 哪 一 个 数字 ， 所 以 如 果 我 们 也 为 数字 定义 一 个 字符 类 DIGIT， 并 对 这 个 字符 类 中 的 任意 字符 
施行 单个 转换 ， 将 其 转换 到 整数 字面 常量 的 状态 ， 我 们 就 能 构造 出 一 个 更 为 紧凑 的 状态 图 ， 

大 多 数 程序 设计 语言 允许 程序 名 在 首 个 字母 后 紧 跟 数 字 。 为 了 从 名 字 第 一 个 字符 后 的 节点 
开始 转换 ， 我 们 使 用 了 在 LETTER 或 DIGIT 上 转换 来 继续 收集 名 字 的 字符 。 

下 面 ， 我 们 来 定义 一 些 在 词法 分 析 器 内 完成 一 般 任务 的 功能 子 程序 。 首 先 ， 我 们 需要 一 个 
名 为 getChaz 的 子 程序 。 当 被 调用 时 ，getchar 从 输入 程序 中 获取 下 一 个 输入 字符 ， 并 将 它 


O 这些 正则 表达 式 是 现在 许多 程序 设计 语言 模式 匹配 的 基础 部 分 (直接 地 或 通过 一 个 类 库 ) 。 
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放 入 全 局 变量 nextcCchar 之 中 。 这 可 能 需要 读 进 输 入 的 下 一 行 或 者 整个 输入 缓冲 区 。 
getchar 还 必须 决定 输入 字符 的 字符 类 ， 并 将 它 放 入 全 局 变量 charclass 之 中 。 对 于 我 们 的 
简单 范例 语言 ， 我 们 有 一 个 字母 的 字符 类 ， 还 有 一 个 数字 的 字符 类 。 由 词法 分 析 右 构造 的 词 
素 可 能 被 实现 为 一 个 字符 串 或 者 一 个 数组 ， 并 将 其 命名 为 1exeme。 

我 们 再 用 一 个 名 为 addCchaz 的 子 程序 来 实现 这 样 的 过 程 : 将 nextChar 内 的 字符 放 人 
1exeme 中 。 这 个 子 程序 必须 被 显 式 调 用 ， 因 为 程序 中 还 包括 了 一 些 不 需要 放 入 Lexeme 中 的 
字符 ， 即 词素 间 的 空白 字符 。 当 调用 词法 分 析 器 时 ， 假 如 输入 的 下 一 个 字符 是 下 一 个 词素 的 
第 一 个 字符 ， 它 是 很 方便 的 。 为 此 ， 使 用 getNonBlank 函 数 来 跳 过 空格 键 。 

了 最后， 我 们 需要 用 一 个 名 为 lLookup 的 子 程序 来 确定 lexeme 中 的 当前 内 容 究 竟 是 一 个 保 
留 字 还 是 一 个 名 字 。 如 果 词 素 不 是 一 个 保留 字 ，1Lookup 子 程序 将 返回 零 值 ， 否 则 将 返回 保留 
字 的 标记 代码 。 在 这 里 ， 假 定名 字 的 标记 代码 为 零 。 标 记 代 码 是 由 编译 器 设计 人 员 随 意 分 配 


给 标记 的 数字 。 
图 4-1 中 的 状态 图 描述 了 我 们 的 标记 模式 。 它 包括 了 状态 图 上 每 一 种 转换 所 需要 的 动作 。 


字母 /数字 





addChar; getChar 


Ps 字母 
局 动 addChar; getChar 
N 数字 


addChar; getChar 







返回 lookup (词素 ) 


返回 Int_Lit 


addChar; getChar 


图 4-1 识别 名 字 、 保 留 字 以 及 整数 字面 常量 的 状态 图 


使 用 程序 来 实现 这 个 状态 图 相对 容易 。 下 面 的 C 函 数 即 是 图 4-1 状 态 图 词法 分 析 器 一 个 例子 : 
/* Global variables */ 

int charClass; 

char lexeme [100]; 

char nextChar; 

int lexLen; 

int LETTER = 0; 

int DIGIT = 1; 

int UNKNOWN = -1; 
/* addChar - a function to add nextChar to lexeme */ 


void addChar() { 
if(lexLen <= 99) 
lexeme[lexLen++] = nextChar; 
else printf(“Error - lexeme is too long \n”); 


} 


/* getChar - a function to get the next character of input 
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and determine its character class */ 


void getChar() { 
/* do whatever is required to get the next 
character from input and put it in nextChar */ 
if (isalpha(nextChar) ) 
charClass = LETTER; 
else if (isdigit(nextChar) ) 
charClass = DIGIT; 
else charClass = UNKNOWN; 


} 


/* getNonBlank - calls getChar until it returns 
a non-whitespace character */ 


void getNonBlank() { 
while(isspace(nextChar) ) 
; getChar(); 


} 


/* lex - a simple lexical analyzer */ 


int lex() { 
lexLen = 0; 
static int first = 1; 


/* If it is the first call to lex, initialize by calling 
getChar */ 


if(first) { 
getChar(); 
first = 0; 


} 
getNonBlank()j; 


switch (charClass) { 
/* Parse identifiers and reserved words */ 


case LETTER: 
addChar(); 


getChar(); 
while (charClass == LETTER | | 
charClass == DIGIT) { 

addChar(); 
getChar(); 

} 

return lookup(lexeme) ; 

break; 


/* Parse integer literals */ 


case DIGIT: 
addChar(); 
getChar(); 
while (charClass == DIGIT) { 
addChar(); 
getChar(); 


} 
return INT LIT; 
break; 
} /* End of switch */ 
} /* End of function lex */ 


这 段 代 码 表 明 词 法 分 析 器 的 相对 简单 性 。 当 然 我 们 在 这 里 省 略 了 完成 许多 必要 工作 并 包括 
了 许多 细 刷 的 功能 函数 。 此 外 ， 我 们 在 这 里 仅仅 处 理 了 一 个 很 小 的 简单 标记 集合 。 

词法 分 析 器 通常 负责 符号 表 的 初始 创建 工作 ， 这 种 符号 表 也 就 是 编译 器 的 名 字数 据 库 。 符 
号 表 中 储存 了 有 关 用 户 定 义 名 字 以 及 这 些 名 字 的 属性 的 信息 。 例 如， 如果 一 个 名 字 是 一 个 变量 ， 
那么 变量 类 型 就 是 名 字 的 一 个 属性 ， 所 以 变量 类 型 将 被 存 和 人 符号 表 之 中 。 通 常 ， 名 字 由 词法 分 
析 器 放 入 符号 表 中 ， 而 名 字 的 属性 则 由 编译 器 的 其 他 部 分 在 词法 分 析 之 后 放 入 符号 表 中 。 


4.3 语法 分 析 问 题 


本 市 讨论 一 般 语法 分 析 问 题 ， 并 将 介绍 两 种 主要 的 语法 分 析 算 法 ， 即 自 顶 向 下 算法 和 自 底 
问 上 算法 ， 还 将 包括 语法 分 析 过 程 的 复杂 性 问题 。 


4.3.1 语法 分 析 介绍 


用 于 程序 设计 语言 的 语法 分 析 器 为 程序 构造 语法 分 析 树 ， 在 某 些 情况 下 ， 只 是 隐 式 地 构造 
语法 分 析 树 ， 这 意味 着 也 许 仅仅 是 产生 了 树 的 遍历 。 但 是 在 所 有 的 情况 下 ， 建 立 语法 分 析 树 所 
必需 的 信息 都 在 语法 分 析 的 过 程 产生 。 无 论 是 分 析 树 还 是 派生 ， 都 包括 了 语言 处 理 器 所 需要 的 
所 有 有 关 语 法 的 信息 。 

语法 分 析 有 两 个 不 同 的 目的 。 首 先 ， 语 法 分 析 必 须 检查 输入 的 程序 ， 以 确定 它 在 语法 上 的 
正确 性 。 一 旦 发 现 错误 ,分 析 器 必须 产生 诊断 信息 ， 并 且 恢 复 编译 。 在 这 里 ， 恢 复 编译 意味 着 
分 析 器 必须 回复 到 正常 状态 ， 并 且 继 续 分 析 输 入 程序 。 这 是 十 分 必要 的 ， 只 有 这 样 ， 编 译 器 才 
能 够 在 一 次 输入 程序 的 分 析 过 程 中 尽 可 能 多 地 发 现 错误 。 如 果 没 有 做 好 ， 从 错误 中 恢复 可 能 会 
产生 更 多 的 错误 ， 或 者 至 少 是 更 多 的 出 错 信息 。 语 法 分 析 的 第 二 个 目的 是 对 于 语法 正确 的 输入 
程序 产生 一 棵 完整 的 语法 分 析 树 ， 或 者 至 少 追踪 整个 语法 分 析 树 的 结构 。 这 棵 语法 分 析 树 (或 
者 是 这 种 追踪 ) 将 被 作为 翻译 的 基础 。 

根据 语法 分 析 器 建立 语法 分 析 树 的 方向 可 以 将 语法 分 析 器 进行 分 类 。 语 法 分 析 器 有 两 大 类 ， 
一 类 是 目 项 同 下 ， 这 类 分 析 树 是 从 树 根 往 下 建造 到 树叶 ， 另 一 类 是 自 底 向 上 ， 这 类 分 析 树 是 从 
树叶 往 上 建造 到 树 根 。 

在 这 一 章 中 ， 为 了 讨论 的 清晰 性 ， 我 们 将 使 用 一 小 组 符号 约定 来 表示 文法 符号 以 及 字符 串 。 
对 于 形式 语言 ， 这 种 符号 约定 如 下 所 示 : 

1. 终结 符 一 一 小 写字 母 表 的 最 前 面 几 个 字母 (a, bye), 

2. 非 终结 符 一 一 大 写字 母 表 的 最 前 面 几 个 字母 (A, B,…)。 

3. 终结 或 者 非 终 结 一 一 大 写字 母 表 的 最 后 面 几 个 字母 (W,X,Y,Z)。 

4. 终结 字符 串 一 一 小 写字 母 表 的 最 后 面 几 个 字母 (w, x,y,z). 

5. 混合 字符 串 (终结 以 及 /或 者 非 终 结 ) 小 写 的 希腊 字母 (a, B, ò, y). 

对 于 程序 设计 语言 而 言 ， 终 结 符 是 语言 的 小 型 语法 构造 或 标记 。 程 序 设计 语言 的 非 终 结 符 
通常 为 由 尖 括 号 包括 起 来 的 隐 含 名 字 或 缩写 。 例 如 <while_ 语 句 >、< 表 达 式 > 和 < 函数 定义 >，。 
一 种 语言 的 语句 (对 于 程序 设计 语言 ， 也 即 程序 ) 是 终结 的 字符 串 。 描 述 文法 规则 RHS 的 混合 
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字符 串 被 用 于 语法 分 析 的 算法 之 中 。 


4.3.2 上 和 目 项 回 下 语法 分 析 器 


自 顶 向 下 语法 分 析 器 按 前 序 跟踪 或 建造 一 棵 语法 分 析 树 。 它 对 应 于 一 个 最 左派 生 。 一 棵 语 
法 分 析 树 的 前 序 遍 历 开 始 于 树 根 。 每 一 个 市 点 都 先 于 它 后 面 的 树枝 被 访问 。 对 于 同一 个 市 扣 的 
树枝 的 访问 ， 遵 循 自 左 向 右 的 顺序 。 

根据 派生 ， 可 以 将 一 个 目 顶 网 下 的 语法 分 析 绒 描述 为 : 当 给 定 的 句 型 是 一 个 最 左派 生 的 部 
分 时 ， 语 潜 分 析 器 的 任务 是 要 在 那个 最 左派 生 之 中 找到 下 一 个 句 型 。 一 个 最 左派 生 的 一 般 形 式 
为 xXAa， 按 照 我 们 的 记号 约定 ，x 是 一 个 终结 符 串 ，A 是 一 个 非 终 结 ，o 则 是 一 个 混合 字符 串 。 
因为 x 只 包括 了 终结 ，A 就 是 这 个 句 型 里 的 最 左 非 终 结 ， 因 而 必须 将 A 扩 展 以 便 在 最 左派 生 中 得 
到 下 一 个 句 型 。 要 确定 下 一 个 句 型 ， 需 要 选择 一 条 正确 的 文法 规则 ， 这 个 规则 必须 以 A 作 为 它 
的 LHS。 例 如 ， 如 果 当 前 的 句 型 为 

XAQ 
并 且 有 A- 规 则 : A 一 bB，A 一 cBb， 以 及 A 一 a。 自 顶 向 下 语法 分 析 器 必须 在 这 三 条 A- 规 则 中 进行 
选择 ， 从 而 获得 下 一 个 句 型 。 这 个 句 型 的 形式 可 能 会 是 : xbBa、xcBboa 或 者 xa0。 这 就 是 自 顶 
向 下 语法 分 析 器 的 分 析 决 策 问 题 。 

不 同 的 自 顶 向 下 算法 运用 不 同 的 信息 进行 语法 分 析 的 决策 。 通 过 比较 输入 的 下 一 个 标记 和 
能 由 那些 规则 的 RHS 产 生 的 开始 符号 ， 最 常用 的 自 顶 向 下 语法 分 析 器 在 当前 句 型 中 为 最 左 非 终 
结 符 选择 正确 的 RHS 。 无 论 哪 个 有 字符 串 右 边 末 尾 标记 的 RHS ， 它 产生 的 都 是 正确 的 。 因 此 ， 
在 xAa 句 型 中 ， 语 法 分 析 器 将 根据 字符 串 x 中 最 后 一 个 词素 后 面 的 任意 标记 来 决定 使 用 哪 一 条 
A- 规 则 ， 以 得 到 下 一 个 句 型。 在 上 面 的 例子 中 ，A- 规 则 的 3 个 RHS 都 用 不 同 的 终结 符 开始 。 语 
法 分 析 器 很 容易 选择 基于 输入 下 一 个 标记 的 正确 的 RHS (这 个 例子 中 ， 必 须 为 a、b 或 c) 。 通 常 ， 
选择 正确 的 RHS 并 不 是 如 此 简单 的 ， 因 为 在 当前 句 型 中 的 一 些 最 左 非 终 结 符 的 RHS 可 能 会 以 一 
个 非 终结 符 开 始 。 

最 常用 的 一 些 自 顶 向 下 语法 分 析 的 算法 ， 相 互 间 是 密切 关联 的 。 递 归 下 降 语法 分 析 器 是 一 
种 直接 基于 语言 语法 的 BNF 描 述 的 语法 分 析 器 的 编码 版 本 。 对 于 递归 下 降 分 析 方 法 的 最 常用 替 
代 方法 ， 是 使 用 一 种 语法 分 析 表 而 不 是 编码 来 实现 BNF 规 则 。 这 两 种 被 称 为 LL 算法 的 方法 具有 
同等 的 功能 ， 这 意味 着 它们 都 处 理 相 同 的 一 个 文法 子 集 。LL 中 的 第 一 个 字母 L 说 明 输 入 扫描 是 
从 左 到 右 ， 而 第 二 个 字母 L 说 明 所 产生 的 是 最 左派 生 。 在 第 4.4 节 将 介绍 如 何 运用 递归 下 降 方 法 
来 实现 一 个 LL 语 法 分 析 器 。 


4.3.3 上 自 底 向 上 语法 分 析 器 


日 底 癌 上 语法 分 析 器 是 由 叶 节 点 开始 向 树 根 发 展 ， 从 而 构造 一 棵 语法 分 析 树 。 自 底 向 上 的 
语法 分 析 器 产生 最 右派 生 的 逆向 。 根 据 派 生 ， 可 以 将 一 个 自 底 向 上 的 语法 分 析 器 描述 为 : 当 给 
定 一 个 右 句 型 a”， 语 法 分 析 器 必须 确定 a 中 的 哪 一 个 子 串 是 在 一 条 文法 规则 的 右边 (RHS), if 
当 将 这 个 子 串 约 减 到 规则 的 LHS 时 ， 就 能 生成 最 右派 生 中 先前 的 句 型。 例如， 自 底 向 上 语法 分 
析 絮 的 第 一 个 步骤 是 决定 最 初 给 定 的 句子 中 哪个 子 串 是 一 条 规则 的 RHS， 并 且 要 被 归 约 到 与 之 
相应 的 LHS 中 ， 以 便 得 到 派生 过 程 里 的 倒数 第 二 个 句 型 。 要 找到 正确 的 RHS 进 行 归 约 是 一 个 复 


O “ 右 句 型 是 一 种 出 现在 最 右派 生 的 句 型 。 
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杂 的 过 程 ， 原 因 是 ， 一 个 右 句 型 可 能 包含 多 个 来 自 被 分 析 语 言 的 文法 中 的 RHS。 正 确 的 RHS 被 
称 为 句柄 (handle), 

考虑 下 面 的 文法 和 派生 : 

S—aAc 

A—>aA lb 

S=aAc=aaAc=aabc 

句子 aabc 的 自 底 向 上 语法 分 析 器 带 着 句子 开始 ， 并 且 必 须 找到 其 中 的 句柄 。 在 这 个 例子 中 ， 
这 古 个 容易 的 任务 ， 因 为 字符 串 只 包含 一 个 RHS:b。 当 语法 分 析 器 用 它 自己 的 LHS (A) 取代 b 
时 ， 它 在 派生 中 得 到 第 二 个 最 后 的 句 型 aaAc。 在 一 般 情况 下 ,- 正如 前 面 所 说 的 ， 找 寻 和 句柄 是 比 
较 困 难 的 ， 因 为 一 个 句 型 可 能 包含 有 许多 不 同 的 RHS。 

日 底 向 上 语法 分 析 器 通过 审查 可 能 句柄 的 一 边 或 两 边 的 符号 来 寻找 一 个 给 定 右 句 型 的 句柄 . 
位 于 可 能 句柄 右边 的 符号 通常 是 输入 中 的 、 但 还 没有 被 分 析 的 标记 。 

取 弟 用 的 自 底 向 上 语法 分 析 的 算法 在 LR 家 族 中 ， 这 里 的 L 说 明 是 从 左 到 右 的 输入 扫描 ， 而 R 
则 说 明 所 产生 的 是 最 右派 生 。 


4.3.4 语法 分 析 的 复杂 性 


任何 用 于 歧义 文法 的 语法 分 析 算法 都 十 分 复杂 与 低 效 。 事实 上 , 这 些 算法 的 复杂 性 是 O (ò), 
这 意味 着 这 类 算法 所 需要 的 时 间 与 被 分 析 字 符 串 长 度 的 三 次 方 成 正比 。 之 所 以 需要 相当 长 的 时 
间 ， 是 因为 这 些 算 法 必须 经 常 进行 备份 ， 并 且 必 须 重复 分 析 句 子 的 某 些 部 分 。 当 语法 分 析 器 在 
分 析 过 程 中 犯 了 错误 时 ， 就 必须 实施 重复 分 析 。 当 将 一 棵 语法 分 析 树 (或 它 的 踪迹 ) 拆 散 并 重建 
上 时， 实施 备 份 也 是 十 分 必要 的 。O (的 算法 因为 太 慢 ， 常 常 不 适 于 实际 的 应 用 ， 例 如 ， 进行 编 
译 角 的 语法 分 析 。 在 这 种 情况 下 ， 计 算 机 科学 家 通常 会 寻找 比较 快 的 算法 ， 尽管 这 些 算法 并 不 
一 定 具 有 普遍 适用 性 。 这 就 意味 着 需要 牺 性 普遍 适用 性 而 换取 高 的 效率 。 就 语法 分 析 而 言 ， 人 
们 常常 发 现 ， 快 速算 法 只 能 够 适用 于 分 析 所 有 可 能 文法 中 的 一 个 子 集 。 当 然 ， 从 要 这 个 子 集 包 
括 了 描述 程序 设计 语言 的 文法 ， 这 样 的 算法 就 是 可 以 接受 的 。( 实 际 上 ， 正如 在 第 3 章 的 讨论 ， 
任何 文法 都 不 足以 描述 大 多 数 程序 设计 语言 的 所 有 语法 ,) 

所 有 用 于 编译 器 的 语法 分 析 器 算法 都 具有 O (n) 的 计算 复杂 性 ， 这 意味 着 它们 所 耗费 的 时 间 
与 被 分 析 字 符 串 的 长 度 成 线性 关系 。 这 较 之 复杂 性 为 O (m) 的 算法 效率 要 高 得 多 。 


4.4 违 归 下 降 语法 分 析 
本 市 介绍 自 顶 向 下 语法 分 析 器 的 实现 过 程 ， 即 递归 下 降 。 
4.4.1 递归 下 降 语法 分 析 过 程 


之 所 以 命名 为 递归 下 降 语法 分 析 器 ， 因 为 它 是 由 一 系列 子 程序 组 成 ， 这 些 子 程序 多 数 为 递 
归程 序 ， 并 且 在 它们 产生 语法 分 析 树 时 都 按 自 顶 向 下 的 顺序 。 这 种 递归 反映 了 程序 设计 语言 
的 性 质 ， 它 们 包括 了 多 种 不 同 的 递归 结构 。 例 如 ， 语句 常常 被 戏 套 于 其 他 的 语句 之 中 。 此 外 
还 有 ， 必 须 正确 地 嵌 套 表达 式 中 的 括号 。 所 有 这 些 结构 的 语法 都 可 以 由 递归 文法 规则 自然 地 
描述 。 

EBNF 对 于 递归 下 降 语法 分 析 器 是 十 分 理想 的 。 第 3 章 曾 讲 过 ， EBNF 主 要 的 一 种 扩展 是 运 
用 化 括号 和 方 括号 。 花 括号 说 明 所 包括 的 部 分 可 以 出 现 零 次 或 者 多 次 ， 而 方 括号 则 说 明 所 包括 
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的 部 分 可 以 出 现 零 次 或 者 一 次 。 注 意 ， 这 两 种 括号 中 所 包括 的 符号 都 是 可 以 选择 的 。 例 如 

< if 语句 > 一 if < BH 表达 式 > < 语句 > [else < 语句 >] 

< 标识 符 表 > 一 标识 符 { ， 标 识 符 } 

在 上 面 的 第 一 条 规则 中 ，if 语 句 的 else 子 句 是 可 选择 的 ， 而 在 第 二 条 规则 中 ，< 标 识 符 _ 
表 > 是 一 个 标识 符 ， 后 面 跟着 一 个 逗号 和 一 个 标识 符 的 零 次 或 多 次 的 重复 。 

对 于 文法 中 的 每 一 个 非 终结 ， 递 归 下 降 语 法 分 析 器 都 有 一 个 对 应 的 子 程序 。 与 一 个 特定 非 
终结 相关 的 子 程序 具有 如 下 责任 : 当 给 出 一 个 输入 字符 串 时 ， 它 都 能 够 追踪 出 一 棵 语法 分 析 树 ， 
树 根 就 是 这 个 非 终 结 ， 树 叶 则 与 输入 的 字符 串 相 匹配 。 在 效果 上 ， 一 个 递归 下 降 语 法 分 析 子 程 
序 就 是 由 相关 非 终结 产生 的 这 种 语言 (一 组 字符 串 ) 的 一 个 语法 分 析 器 。 

考虑 下 面 的 简单 算术 表达 式 的 EBNF 描 述 : 

< 过 区 站 

< 

< 因子 > 一 标识 符 | ( < 表达 式 > ) | 

回忆 在 第 3 章 的 描述 ， 一 个 算术 表达 式 的 EBNF 文 法 (例如 上 面 的 这 个 ) 并 不 强制 任何 结合 
性 规则 。 因 而 ， 当 使 用 这 样 的 文法 作为 编译 器 的 基础 时 ， 我 们 必须 小 心地 确保 ， 这 种 通常 由 语 
法 分 析 驱 动 的 代码 生成 过 程 生 成 的 代码 与 语言 的 结合 规则 相 一 致 。 使 用 递归 下 降 的 语法 分 析 时 
可 以 很 容易 地 做 到 这 一 点 。 

我 们 用 下 面 的 递归 下 降 函 数 expr 作 为 一 个 例子 ， 在 这 个 例子 里 ， 词 法 分 析 器 是 一 个 被 命名 
为 lex 的 沙 数 。lex 函 数 获取 下 一 个 词素 ， 并 且 将 词素 的 标记 代码 放 入 全 局 变量 nextToken.。 
标记 代码 被 定义 为 命名 常量 。 例 如 ，PLUS_CODE 是 加 号 标记 代码 的 一 个 命名 常量 。 

只 有 一 个 RHS 的 规则 的 递归 下 降 子 程序 相对 简单 些 。 将 RHS 中 的 每 一 个 终结 符 都 与 变量 
nextToken 进 行 比较 ， 如 采 它 们 不 匹配 ， 就 是 一 个 语法 错误 ， 如 果 它 们 相 匹 配 ， 则 调用 词法 分 
析 絮 以 便 再 获取 下 一 个 输入 标记 。 对 于 每 一 个 非 终 结 ， 就 调用 对 应 于 这 个 非 终 结 的 语法 分 析 子 
程序 。 

对 于 上 面 文法 例子 中 的 第 一 条 规则 ， 用 C 语 言 编写 的 递归 下 降 子 程序 如 下 : 

/* Function expr 

Parses strings in the language generated by the rule: 
<expr> -> <term> {(+ | -) <term>} 


*/ 
void expr() { 


/* Parse the first term */ 
term(); 


/* As long as the next token is + or -, call lex to get 
the next token, and parse the next term */ 


while (nextToken == PLUS CODE | | 
nextToken == MINUS CODE) { 
lex(); 
term( ); 
} 
} 


编写 递归 下 降 子 程序 有 一 个 协定 ， 即 每 一 个 子 程序 都 在 nextToken 中 放 入 下 一 个 输入 的 标 
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记 。 因 而 ， 当 开始 一 个 语法 分 析 函 数 时 ， 假 定 nextToken 具 有 还 没有 被 语法 分 析 过 程 使 用 的 输 
入 标记 中 最 左面 的 一 个 标记 。 
exPL 国 数 所 分析 的 语言 部 分 包括 ; 被 加 号 或 减 号 分 开 的 一 项 或 多 项 。 这 就 是 由 非 终结 < 表 
达 式 > 生成 的 语言 。 因 而 它 首先 调用 对 项 (< 项 >) 进行 语法 分 析 的 函数 ， 然 后 它 就 继续 调用 这 
个 国 数 ， 直 到 找到 了 PLUS_CODBE 或 MINUS_CODE 标 记 (通过 调用 lex 来 进行 传递 ) ， 这 个 递归 
下 降 函 数 比 大 多 数 情况 都 简单 ， 因 为 它 的 规则 只 包含 一 项 RHS。 此 外 ， 它 不 包括 任何 检测 语法 
错误 或 进行 恢复 的 代码 ， 因 为 不 存在 与 这 条 文法 规则 相关 的 任何 可 检测 错误 。 
当 一 个 非 终结 的 规则 具有 多 项 RHS 时 ， 这 个 非 终 结 的 递归 下 降 语 法 分 析 子 程序 普 先 从 确定 
究竟 对 哪个 RHS 进 行 语 法 分 析 开 始 。 在 编译 器 的 构造 时 期 ， 需 要 检测 每 个 RHS， 以 确定 哪 _ 组 
符 结 符 可 以 出 现在 所 产生 句子 的 开头 部 分 。 通 过 将 这 一 组 终结 符 与 下 一 个 输入 的 标记 相 匹 本 
语法 分 析 器 就 能 够 选择 出 正确 的 RHS, 
< 项 > 的 语法 分 析 子 程序 与 < 表达 式 > 的 语法 分 析 子 程序 相 类 似 ， 
/* Function term 
Parses strings in the language generated by the rule: 
<term> -> <factor> {(* | /) <factor>} 


* / 
void term() { 


/* Parse the first factor */ 
factor(); 


/* As long as the next token is * or /, call lex to get 
the next token, and parse the next factor */ 


while (nextToken == AST CODE | | 
nextToken == SLASH CODE) { 
lex(); 
factor(); 
} 
} 


我 们 的 算术 表达 式 文 法 中 用 来 分 析 非 终结 < 因子 > 的 函数 必须 在 两 个 RHS 之 中 做 出 选择 。 
这 个 国 数 还 包括 了 错误 检测 。< 因 子 > 的 函数 中 ， 在 发 现 一 个 语法 错误 时 所 采取 的 行动 仅仅 是 调 
用 error 函 数 。 而 当真 正 的 语法 分 析 器 发 现 错误 时 ， 必须 产生 诊断 信息 。 此 外 ， 语 法 分 析 器 必 
须 能 够 从 错误 中 恢复 ， 以 便 继续 进行 语法 分 析 过 程 。 
/* Function factor 
Parses strings in the language generated by the rule: 


<factor> -> id | (<expr>) 
*/ 


void factor() { 
/* Determine which RHS */ 


if (nextToken == ID_CODE) 
/* Get the next token */ 


lex(); 
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/* If the RHS is (<expr>), call lex to pass over the left 
parenthesis, call expr, and check for the right 
parenthesis */ 


else if (nextToken == LEFT_PAREN_CODE) { 
lex(); 
expr(); 
if (nextToken == RIGHT PAREN CODE) 
lex(); 
else 
error(); 
} /* End of else if (nextToken ==... */ 


/* It was neither an id nor a left parenthesis */ 


else error(); 


} 


要 跟踪 语法 分 析 ， 可 以 在 每 一 个 语法 分 析 子 程序 的 头 部 与 尾部 都 加 上 人 代码。 另外， 在 追踪 
里 也 可 以 加 上 每 次 对 lex 函 数 的 调用 ， 其 中 包括 被 返回 的 标记 。 例 如 ， 在 expr 函 数 的 头 部 可 以 


加 上 : 


printf("Enter <expr> \n"); 


而 在 该 函数 的 尾部 可 以 加 上 


printf("Exit <expr> \n"); 


下 面 是 使 用 语法 分 析 函 数 expr，term，factor 以 及 lex 对 a + b 进 行 语法 分 析 的 追踪 。 请 
注意 ， 这 个 语法 分 析 开 始 于 对 lex 函 数 以 及 起 始 符 子 程序 的 调用 ， 在 这 个 情形 中 ， 起 始 符 子 程 


序 即 为 expr。 
Call lex /* returns a */ 
Enter <expr> 
Enter <term> 
Enter <factor> 
Call lex /* returns + */ 
Exit <factor> 
Exit <term> 
Call lex /* returns b */ 
Enter <term> 
Enter <factor> 


Call lex /* returns end-of-input */ < 表达 式 > 
Exit <factor> 
Exit <term> 
Exit <expr> < 项 > < 项 > 
| | 
图 4-2 显 示 了 由 这 个 语法 分 析 器 所 追踪 产生 的 语法 分 析 树 。 ae ii 
下 面 古 对 Java 中 if 语 句 的 语法 描述 : a + b 
<if_ 语 句 > if (< 布尔 表达 式 >) < 语句 > [else < 语句 >] 图 4-2 a + b 的 语法 分 析 树 


这 条 规则 的 递归 下 降 子 程序 如 下 所 示 : 


/* Function ifstmt 
Parses strings in the language generated by the rule: 
<ifstmt>->if (<boolexpr>) <statement> 


18] i DM Ae TE i DAT 123 


[else <statement>] 
*/ 
void ifstmt() { 
/* Be sure the first token is ‘if’ */ 
if (nextToken != IF CODE) 
error(); 
else { 
/* Call lex to get to the next token */ 


lex(); 
/* Check for the left parenthesis */ 
if (nextToken != LEFT PAREN CODE) 
error(); 
else { 
/* Call boolexpr to parse the Boolean expression */ 
boolexpr(); 
/* Check for the right parenthesis */ 
if (nextToken != RIGHT PAREN CODE) 
error(); 
else { 
/* Call statement to parse the then clause */ 
statement(); 
/* If an else is next, parse the else clause */ 
if (nextToken == ELSE CODE) { 
/* Call lex to get over the else */ 
lex(); 
statement (); 
} /* end of if (nextToken == ELSE CODE ... */ 
} /* end of else of if (nextToken != RIGHT ... */ 
} /* end of else of if (nextToken != LEFT ... */ 
} /* end of else of if (nextToken l= IF CODE ... */ 
} /* end of ifstmt */ 


所 有 这 些 例子 的 目的 是 想 让 读者 们 相信 ， 对 于 任何 一 种 语言 ， 只 要 具有 合适 的 文法 ， 就 很 
容易 编写 递归 下 降 语法 分 析 器 。 在 下 面 的 小 节 里 ， 我 们 就 来 讨论 那些 能 够 让 我 们 构建 递归 下 降 
语法 分 析 的 文法 特征 。 


4.4.2 LL 文法 类 


在 选择 递归 下 降 作 为 编译 器 或 其 他 程序 分 析 工 具 的 语法 分 析 策 略 之 前 ， 我 们 必须 考虑 到 这 
种 方式 在 有 关 文 法 限制 方面 的 局 限 性 。 本 节 将 讨论 这 些 有 关 的 限制 以 及 可 能 的 解决 办 法 。 

有 一 种 简单 的 文法 特征 会 给 LL 语法 分 析 器 带 来 灾难 性 的 问题 ， 它 就 是 左 递归 。 例 如 ， 考 虑 
下 面 的 规则 : 

A—A+B 

A 的 递归 下 降 语法 分 析 器 子 程序 会 立刻 调用 自身 来 对 RHS 中 的 第 一 个 符号 进行 语法 分 析 。 
油 活 这 个 语法 分 析 子 程序 将 导致 它 即刻 再 次 调用 自身 ， 一 次 又 一 次 ， 如 此 反复 。 显 然 ， 这 将 是 
无 休止 的 。 

在 规则 A 一 A+B 中 的 左 递 归 称 为 直接 左 递归 ， 因 为 它 出 现在 同一 条 规则 里 。 直 接 左 递归 可 
V 通 过 下 面 过 程 的 文法 来 消除 : 

对 于 每 个 非 终结 符 ，A， 

1. 将 A- 规 则 分 组 为 A 一 Aa， l-A an lBilB,l: 1B, 

这 里 ，B 都 不 以 A 开始 。 
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2. 用 下 面 内 容 取 代 最 初 的 A- 规 则 

A—> BA’ IB,A’l...IB,A 

A >q A’lœA’l..lanA’ le 

注意 ，s 表 示 空 字符 串 。 让 es 作 为 RHS 的 规则 称 为 消除 规则 ， 因 为 在 派生 中 使 用 它 可 以 从 名 
型 中 有 效 地 消除 它 的 LHS。 

考虑 下 面 例子 的 文法 和 上 面 过 程 的 运用 : 

E>E+TIT 

TeT * FIF 

F—(E) | id 

对 于 E- 规 则 ， 有 coi=+T 和 B=T， 因 此 ， 用 以 下 内 容 替 代 E- 规 则 

E=TE’ 

E’—+TE’ le 

对 于 T- 规 则 ， 有 ow=*F 和 B=F， 因 此 ， 用 以 下 内 容 替代 T- 规 则 

T=FT 

i a od Ba E 

因为 在 F- 规 则 中 没有 左 递归 ， 它 们 保持 相同 ， 所 以 完整 的 替代 文法 是 

ETE’ 

E’—+TE’ le 

TFT 

二 

F—(E) | id 

该 文法 产生 oo HEBR EA 


设计 基于 该 文法 的 代码 生成 是 相对 容易 的 ， teen a aa A = 

间接 左 递归 也 具有 与 直接 左 递归 相同 的 问题 。 例 如 ， 假 设 我 们 有 

A 一 BaA 

B-Ab 

这 些 规 则 的 一 个 递归 下 降 语 法 分 析 器 将 使 得 A 的 子 程序 立即 调用 B 的 子 程序 ， 而 B 的 子 程序 
义 再 立即 调用 A 的 子 程序 。 所 以 ， 这 里 的 问题 与 直接 左 递 归 的 问题 是 相同 的 。 左 递归 的 问题 不 
仅仅 局 限于 以 递归 下 降 方式 来 建造 的 自 顶 向 下 语法 分 析 器 ， 它 是 所 有 自 顶 向 下 语法 分 析 算 法 的 
一 个 共同 问题 。 幸 运 的 是 ， 左 递归 对 于 自 底 向 上 的 语法 分 析 算 法 不 存在 问题 。 

有 一 种 修改 给 定 文法 的 算法 可 以 用 来 排除 间接 的 左 递归 (Aho er al.，1986)。 然 而 我 们 不 会 
在 这 里 进行 介绍 。 当 为 一 种 程序 设计 语言 编写 文法 时 ， 必 须 小 心 避 免 采 用 任何 直接 和 间接 的 
递归 。 

左 递 归还 不 是 我 们 所 不 能 接受 的 唯一 的 自 顶 向 下 语法 分 析 的 文法 特性 。 另 一 个 这 样 的 特性 
为 ， 是 否 语法 分 析 器 总 能 根据 下 一 个 输入 的 标记 来 选择 正确 的 RHS。 对 于 非 左 递 归 的 文法 ， 有 
一 种 相对 简单 的 测试 ， 它 能 够 测 出 语法 分 析 器 能 否 以 这 样 的 方式 来 选择 正确 的 RHS。 这 种 测试 
称 为 成 对 不 相交 测试 (pairwise disjointness test)。 这 种 测 | 试 要 求 能 够 根据 一 种 文法 给 定 的 非 终 
结 符 的 RHS 计 算出 一 个 被 称 为 FIRST 的 集合 。 FIRST 集 合 的 定义 如 下 : 

FIRST(0) = {a | œ =>* aß} (If 0 =>* g, £ is in FIRST(0)) 
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这 里 的 =>* 意味 着 0 或 多 个 派生 步骤 。 

在 Aho 等 人 的 文献 (Aho etal., 1986) 中 能 够 发 现 对 于 任何 混合 字符 串 a 计 算 FIRST 的 算法 ， 
单 就 我 们 的 目的 而 言 ， 常 常 能 够 通过 检测 文法 的 自身 来 计算 FIRST, 

成 对 不 相交 测试 为 : 

对 于 具有 多 个 RHS 的 文法 中 的 每 一 个 非 终 结 A， 

对 于 每 一 对 规则 A 一 oj 和 A 一 a, FIRST) N FIRST(Q) = 中 必须 为 真 。 

(BIFIRST(o,) 与 FIRST(0) 两 集合 的 交集 必须 为 空 。) 

换言之 ， 如 果 非 终结 A 具有 多 个 RHS， 在 每 个 RHS 的 派生 中 产生 的 第 一 个 终结 符 对 于 这 个 
RHS 都 必须 是 唯一 的 。 考 虑 下 面 的 规则 : 

A—aBlbAblBb 

B — cB id 

对 于 这 些 规则 的 三 个 RHS， 三 个 FIRST 的 集合 分 别 为 {ay，{fb } 和 { c }， 这 些 集合 显然 是 不 
相交 的 。 因 此 ， 这 些 规则 通过 了 成 对 不 相交 测试 。 这 意味 着 ， 就 递归 下 降 语法 分 析 器 而 言 ， 对 
于 非 终结 A 进行 语法 分 析 的 子 程序 可 以 通过 观察 在 输入 中 这 个 非 终结 所 产生 的 第 一 个 终结 符 
(标记 )， 来 选择 处 理 哪 一 个 RHS。 现 在 考虑 下 面 的 规则 : 

A —> aB | BAb 

B — aBlb 

这 两 条 规则 中 的 两 个 RHS 的 FIRST 集 合 分 别 为 { a } 和 { a }, 它们 显然 是 相交 的 。 因 而 ， 这 些 
规则 不 能 通过 成 对 不 相交 测试 。 就 语法 分 析 器 而 言 ， A 的 子 程序 就 不 能 仅仅 通过 检测 下 一 个 输 
入 符号 来 确定 对 哪个 RHS 进 行 语法 分 析 。 因为 如 果 它 是 a 的 话 ， 可 以 选择 两 个 RHS 中 的 任意 一 个 。 
如 本 一 个 或 多 个 RHS 开 始 于 非 终 结 ， 这 个 问题 自然 会 变 得 更 复杂 

在 许多 情况 下 ， 可 以 对 没有 通过 成 对 不 相交 测试 的 文法 进行 修改 ， 使 得 它 在 修改 后 能 够 通 
过 这 个 测试 。 例 如 ， 考 虑 规则 

< 变量 > 一 标识 符 | 标识 符 [ < 表达 式 > ] 

这 里 的 规则 说 明 ， 一 个 < 变量 > 可 以 是 一 个 标识 符 ， 也 可 以 是 一 个 标识 符 后 面 跟随 一 个 在 方 
括号 内 的 表达 式 (下 标 )。 这 些 规则 显然 不 能 通过 成 对 不 相交 测试 ， 因 为 这 两 个 RHS 起 始 于 相 
同 的 终结 符 ， 即 标识 符 。 经 过 一 个 被 称 为 提取 左 因子 (left factoring) 的 过 程 ， 这 个 问题 能 够 得 
到 缓解 。 

现在 我 们 非 正 式 地 讨论 一 下 提取 左 因 子 问题 。 考虑 上 面 的 < 变量 > 规则 ， 其 中 两 个 RHS 都 由 
标识 符 开始 ， 在 两 个 RHS 中 跟随 标识 符 后 面 的 部 分 为 ( 空 字符 串 ) 和 [< 表达 式 >]。 可 以 将 这 两 
条 规则 替换 为 

< 变量 > 一 标识 符 < 新 的 > 

这 里 < 新 的 > 被 定义 为 

< MAJ > 一 e| [ < 表达 式 > ] 

不 难看 出 ， 这 两 条 规则 一 起 产生 与 开始 时 的 两 条 规则 相同 的 语言 。 然而 ， 这 两 条 规则 通过 
了 成 对 不 相交 测试 。 

如 采 要 将 这 条 文法 作为 递归 下 降 语法 分 析 器 的 基础 ， 我 们 还 可 以 提出 避免 提取 左 因子 的 一 
种 替代 方法 。 使 用 一 种 EBNF 的 扩展 方法 ， 可 以 产生 非常 类 似 于 提取 左 因子 的 方案 用 于 解决 上 
面 的 问题 。 考 虑 上 面 的 第 一 条 < 变量 > 规则 。 通过 将 下 标 放置 于 方 括 号 之 中 ， 下 标 就 可 以 成 为 可 
选择 的 ， 如 


志 
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< 变量 > 一 标识 符 [ I < 表达 式 > ] J 

在 这 条 规则 中 ， 外 层 方 括号 是 元 语言 符号 ， 说 明 括 号 内 的 内 容 是 可 选择 的 。 内 层 方 括号 是 
被 描述 的 程序 设计 语言 的 终结 符 。 这 里 的 要 反 是 ， 我 们 使 用 一 条 规则 代 蔡 了 两 条 规则 ， 这 条 规 
则 产生 的 是 相同 的 语言 ， 并 且 通 过 了 成 对 不 相交 测试 。 

提取 左 因子 的 形式 算法 能 在 Aho 等 人 的 文献 (Aho etal., 1986) 中 找到 。 提 取 左 因子 不 能 
够 解决 文法 中 所 有 的 成 对 不 相交 问题 。 在 某 些 情况 下 ， 必 须 采用 其 他 的 方式 来 重新 编写 文法 规 
则 ， 才 能 消除 这 个 问题 。 


45 自 底 问 上 语法 分 析 
本 节 介 绍 自 底 向 上 语法 分 析 的 一 般 过 程 ， 并 且 描 述 LR 语法 分 析 算法 。 
45.1 自 底 向 上 语法 分 析 器 的 语法 分 析 问 题 


芳 虑 下 面 的 文法 ， 这 个 文法 产生 的 算术 表达 式 包括 了 加 法 和 乘法 操作 符 、 括 号 以 及 操作 数 id。 


E> E+T | T 
ToT+*F IF 
F— (E) | id 
请 注意 ， 这 个 文法 与 第 4.4 节 的 例子 中 的 文法 产生 同样 的 算术 表达 式 。 它 们 的 差别 在 于 ， 这 
个 文法 是 左 递归 的 ， 它 能 够 被 自 底 向 上 的 语法 分 析 器 所 接受 。 也 请 注意 ， 自 底 向 上 的 语法 分 析 
器 通 弟 不 包括 元 符号 ， 例 如 那些 用 来 说 明 BNF 扩 展 的 元 符号 。 下 面 的 最 右派 生 给 出 了 这 种 文法 : 
E =>E+T 
-> E+T*F 
=>E+T * id 
=> E+F * id 
=> E + id * id 
=> T + id * id 
=> F + id * id 
=> id + id * id 


派生 的 句 型 中 有 下 划 线 的 部 分 都 是 RHS ， 将 RHS 重 写 为 与 之 对 应 的 LHS， 以 便 获 得 前 一 个 
句 型 。 目 底 向 上 的 语法 分 析 过 程 产生 最 右派 生 的 逆 过 程 ， 因 而 在 上 面 的 派生 中 ， 一 个 自 底 向 上 
的 语法 分 析 器 开始 于 最 后 名 型 ( 即 输 入 句子 )， 从 那里 开始 产生 一 系列 的 句 型 ， 直 到 只 剩 下 起 始 
从 为 止 。 在 这 个 文法 里 起 始 符 为 E。 在 每 一 个 步骤 中 ， 自 底 向 上 语法 分 析 器 的 任务 是 要 找到 句 
型 中 的 某 个 RHS (句柄 )， 而 又 必须 将 这 个 RHS 重 写 ， 以 便 获得 下 一 个 (前 一 个 ) WH. ATE 
过 ,一 种 右 句 型 可 以 包括 多 个 RHS。 例 如 ， 右 句 型 

E + T “id 

包括 了 三 个 RHS， 即 E + T、T 和 id。 在 它们 中 间 ， 只 有 一 个 RHS 是 句柄 。 例 如 ， 如 果 选 择 
这 个 句 型 中 的 E + IT 进行 重 写 ， 所 产生 的 名 型 会 是 E * id， 但 是 E * id 对 于 给 定 的 文法 是 不 合法 
的 右 句 型 。 

右 句 型 的 句柄 是 唯一 的 。 自 底 向 上 语法 分 析 器 的 任务 是 要 找到 任何 给 定 右 句 型 的 句柄 ， 它 
能 够 通过 与 之 相关 的 文法 来 产生 。 句 柄 的 形式 定义 为 ; 

定义 : BREA A) By = cpBw 的 句柄 ， 当 且 仅 当 S =>* ,aAw => ,aBw。 

在 这 个 定义 中 ，=> m 说 明 一 个 最 右派 生 的 步骤 ，=>* 则 说 明 零 个 或 多 个 最 右派 生 的 步骤 . 
尽管 句柄 的 定义 在 数学 形式 上 很 精确 ， 然 而 这 对 于 如 何在 给 定 的 右 句 型 中 确定 句柄 却 并 没有 帮 


助 ， 我 们 在 下 面 给 出 与 句柄 相关 的 句 型 的 子 字符 串 的 定义 ， 目 的 在 于 提供 一 些 对 句柄 的 直觉 。 
定义 ; B 是 右 句 型 y 的 一 个 短语 ， 当 且 仅 当 S =>"y = QIAo2 = >+ a fa, 
在 这 个 定义 中 ，=>+ 意味 着 一 个 或 多 个 派生 步骤 。 
定义 : B 是 右 句 型 y 的 一 个 简单 短语 ， 当 且 仅 当 S=>"y=a,Aq, => apa, 
如 果 仔 细 比 较 这 两 种 定义 ， 你 会 发 现 它们 的 差别 只 是 在 最 后 一 项 派生 的 说 明 。 有 关 短 语 的 
定义 使 用 了 一 个 或 多 个 步 又， 而 有 关 简 单 短语 的 定义 却 严格 地 仅 使 用 一 个 步 又。 
短语 和 简单 短语 的 定义 看 起 来 似乎 与 句柄 的 定义 一 样 缺乏 实用 价值 ， 然 而 事实 上 却 并 非 如 
此 。 让 我 们 来 考虑 短语 是 怎样 与 语法 分 析 树 相关 联 的 。 短 语 是 字符 串 ， ee ae [189] 
有 时 节点 ， 而 这 棵 子 树 的 根 是 整个 语法 分 析 树 的 一 个 内 部 


节点 。 简 单 短语 是 以 作为 根 的 非 终结 节点 只 经 过 单个 派生 
步骤 产生 的 短语 。 就 语法 分 析 树 而 言 ， 短 语 可 以 派生 自 位 
于 语法 分 析 树 的 单 层 或 多 层 上 的 非 终结 ， 但 一 条 简单 短语 
就 只 可 以 派生 于 语法 分 析 树 的 单 层 之 上 。 考 虑 图 4-3 所 显示 
的 语法 分 析 树 。 +, 


图 4-3 中 语法 分 析 树 的 树叶 包含 句 型 E + T x id。 因 为 
这 棵 树 具 有 三 个 内 部 市 点 ， 因 此 就 有 三 条 短语 。 每 一 个 内 
部 节点 都 是 一 棵 子 树 的 根 ， 而 一 棵 子 树 的 所 有 树叶 都 是 短 
语 。 整 个 语法 分 析 树 的 根 E 产 生 的 是 完整 句 型 E+ * id， 它 同时 也 是 一 条 短语 。 内 部 市 点 T 产 
生 的 是 树叶 T * id， 它 也 是 一 条 短语 。 最 后 的 一 个 内 部 市 尽 F 产 生 短语 。 所 以 句 型 E +T * id 的 
三 条 短语 分 别 为 E+ T* 这 、T* id 和 id。 请 注意 ， 短 语 在 分 析 文 法 中 不 必 是 RHS。 

简单 短语 是 短语 的 一 个 子 集 。 在 上 面 的 例子 中 ，id 是 唯一 的 简单 短语 ， 而 简单 短语 总 是 文 
法 中 的 RHS 。 

我 们 讨论 短语 和 简单 短语 的 理由 是 : 任意 最 右 句 型 的 句柄 是 最 左 的 简单 短语 。 假 设 我 们 已 经 
有 了 一 个 右 句 型 的 文法 并 且 可 以 画 出 语法 分 析 树 ， 我 们 现在 就 有 了 一 种 高 度 直观 的 方法 来 找到 这 
个 右 句 型 的 句柄 。 对 于 语法 分 析 器 ， 以 这 种 方式 来 寻找 句柄 当然 是 不 切实 际 的 (如 果 已 经 有 了 分 
析 树 ， 为 什么 还 需要 语法 分 析 器 ?)。 这 里 的 唯一 目的 只 是 为 了 给 读者 提供 一 些 直觉 ， 以 便 理解 相 
对 于 分 析 树 而 言 什么 是 句柄 。 我 们 认为 这 种 方法 比试 图 用 句 型 来 找到 句柄 要 更 容易 一 些 。 

我 们 现在 可 以 从 语法 分 析 树 的 角度 来 考虑 自 底 向 上 的 语法 分 析 ， 尽 管 语法 分 析 的 目的 是 要 
产生 语法 分 析 树 。 如 果 给 出 整个 句子 的 语法 分 析 树 ， 你 就 会 很 容易 找到 句柄 ， 它 是 句子 中 第 一 
个 需要 重新 改写 以 便 产 生前 一 个 句 型 的 串 。 在 改写 之 后 ， 可 以 将 句柄 从 语法 分 析 树 上 修剪 下 来 ， 
并 重复 这 一 过 程 ， 一直 进行 到 分 析 树 的 根 ， 就 能 构成 完整 的 最 右派 生 。 


4.5.2 移 进 - 归 约 算法 


自 底 向 上 的 语法 分 析 器 常常 也 被 称 为 移 进 - 归 约 算法 ， 因 为 移 进 (shift) 与 归 约 (reduce) 
是 这 种 算法 中 最 常用 的 两 种 运算 。 每 个 自 底 向 上 语法 分 析 器 不 可 或 缺 的 部 分 是 栈 。 移 进 运 算 将 
下 一 个 输入 标记 移 到 语法 分 析 器 的 栈 上 ， 归 约 运算 则 将 语法 分 析 器 栈 顶 的 RHS 替 换 为 与 之 对 应 
的 LHS。 一 个 任意 类 型 的 语法 分 析 器 是 一 个 下 推 自动 机 (pushdown automaton，PDA)。 人 们 并 
不 需要 熟悉 了 PDA 才 能 够 理解 一 个 自 底 向 上 的 语法 分 析 器 是 怎样 工作 的 ， 当 然 熟悉 PDA 会 有 助 
于 这 种 理解 。PDA 是 一 台 非 常 简单 的 数学 机 器 ， 它 从 左 到 右 扫 描 符号 串 。 之 所 以 命名 为 下 推 自 
动机 ， 是 因为 它 使 用 下 推 栈 作 为 它 的 存储 器 。 可 以 使 用 PDA 作 为 语言 的 识别 器 。 当 给 定 特定 字 
符 集合 中 的 一 个 符号 串 ， 专 门 为 识别 目的 而 设计 的 PDA 就 可 以 确定 这 个 符号 串 是 否 是 某 一 种 语 


图 4-3 E+T* id 的 语法 分 析 树 
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言 中 的 句子 。 在 这 一 过 程 中 ，PDA 可 以 产生 构造 句子 语法 分 析 树 所 需要 的 信息 。 

可 以 使 用 PDA 来 检测 输入 字符 串 ， 从 左 到 右 ， 一 次 一 个 字符 。 这 种 输入 处 理 的 方式 就 好 像 
这 个 字符 串 是 储存 于 另 一 个 栈 上 ， 因 为 PDA 只 能 看 见 输入 中 的 最 左 符号 。 

必须 注意 的 是 ， 递 归 下 降 语 法 分 析 器 也 是 一 个 PDA。 这 种 分 析 器 的 栈 就 是 运行 时 系统 的 栈 ， 
它 记 录 了 对 应 于 文法 中 的 非 终结 的 子 程序 的 调用 (还 有 一 些 其 他 的 信息 )。 


4.5.3 LR 语 法 分 析 器 


人 们 设计 了 许多 不 同 种 类 的 自 底 向 上 语法 分 析 的 算法 ， 其 中 的 大 部 分 是 一 个 被 称 为 LR 的 过 
程 的 变种 。LR 语 法 分 析 器 使 用 相对 小 的 程序 以 及 一 个 语法 分 析 表 。 最 初 的 LR 算法 由 Donald 
Knuth 设 计 (Knuth，1965)。 这 种 算法 有 了 时 被 称 为 规范 LR。 这 种 算法 在 发 布 后 的 几 年 间 都 没有 
获得 应 用 ， 因 为 产生 语法 分 析 表 需 要 大 量 的 计算 机 时 间 以 及 存储 空间 。 后 来 ， 几 种 规范 LR 表 构 
造 过 程 的 变 体 又 被 开发 了 出 来 (DeRemer, 1971; DeRemer & Pennello, 1982) 。 这 些 变 体 具有 如 
下 两 种 性 质 : (1) 产生 语法 分 析 表 只 需要 比 标准 LR 算法 更 少 的 计算 机 资源 ，(2) 能 够 将 它们 用 
于 比 规范 LR 算法 更 小 型 的 文法 上 。 

LR 语法 分 析 器 有 许多 优点 : 

1. 所 有 的 程序 设计 语言 都 能 构建 它们 。 

2. 在 从 左 到 右 的 扫描 中 ， 它 们 能 够 尽 可 能 早 地 发 现 语法 错误 。 

3. LR 类 文法 是 可 由 LL 语法 分 析 器 进行 语法 分 析 的 文法 类 型 的 超 集 (例如 ， 许 多 左 递归 文法 
都 是 LR， 但 它们 都 不 是 LL)。 

LR 语法 分 析 的 唯一 缺点 是 很 难 用 手工 方式 产生 给 定 文法 的 语法 分 析 表 。 然 而 ， 这 并 不 是 一 
个 严重 的 缺点 ， 因 为 有 许多 程序 以 文法 为 输入 ， 然 后 产生 语法 分 析 表 ， 这 将 在 本 节 后 面 讨论 。 

在 LR 语 法 分 析 算 法 出 现 之 前 ， 曾 经 有 过 一 些 语法 分 析 的 算法 ， 这 些 算法 通过 检测 可 能 为 名 
柄 的 句 型 字符 串 的 左右 两 边 ， 来 寻找 右 句 型 的 句柄 。Knuth 的 见解 是 ， 你 可 以 有 效 地 检测 这 个 可 
能 句柄 的 左边 ， 一 直到 语法 分 析 栈 的 底 端 为 止 ， 以 便 确定 它 到 底 是 不 是 句柄 。 所 有 与 语法 分 析 
过 程 相 关 的 语法 分 析 栈 的 信息 可 以 由 一 个 单个 状态 来 代表 ， 这 个 状态 位 于 栈 的 顶端 。 换 言 之 ， 
Knuth 发 现 就 语法 分 析 过 程 而 言 ， 不 论 输 入 字符 串 的 长 度 如 何 ， 句 型 的 长 度 如 何 ， 或 者 是 语法 分 
析 栈 的 深度 如 何 ， 只 存在 少数 不 同 的 情形 ， 而 每 一 种 情形 都 可 以 由 一 个 状态 来 代表 ， 并 将 它 储 
存 于 栈 中 。 一 个 状态 对 应 于 栈 中 一 个 文法 符号 。 栈 的 顶端 总 是 一 个 状态 符 ， 它 代表 到 目前 为 上 
的 整个 语法 分 析 史 的 信息 。 我 们 将 使 用 带 有 下 标的 大 写字 母 S 来 表示 语法 分 析 器 的 状态 ， 

图 4-4 显 示 一 个 LR 语 法 分 析 器 的 结构 。 





图 4-4 LR 语法 分 析 器 的 结构 
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LR 语法 分 析 器 的 语法 分 析 栈 的 内 容 具 有 下 面 的 形式 : 

SUXISIX…X SS (Min) 

这 里 S 为 状态 符号 ，X 为 文法 符号 。LR 语 法 分 析 器 结构 是 一 对 字符 串 〈 栈 ， 输 入 ) ， 其 具体 
形式 为 : 

(SoX1S1X2S2°** XnSn, aiair1'."an$) 

注意 ， 在 输入 字符 串 的 右 端 有 一 个 “$” 符 号 ， 这 个 符号 在 语法 分 析 器 设 定 初 值 的 期 间 就 已 
经 放置 在 那里 。 它 被 用 于 使 语法 分 析 器 能 够 正常 地 终止 。 使 用 这 种 语法 分 析 器 的 结构 ， 我 们 就 
能 够 形式 地 定义 基于 语法 分 析 表 的 LR 语 法 分 析 器 的 过 程 。 

一 个 LR 语 法 分 析 表 具有 两 个 分 别 命名 为 ACTION 和 GOTO 的 部 分 。 语 法 分 析 表 的 ACTION 
部 分 说 明 这 个 语法 分 析 器 所 施行 的 大 部 分 工作 。 它 以 状态 符 作为 行 的 标号 ， 以 文法 里 的 终结 符 
作为 列 的 标号 。 当 给 出 当前 语法 分 析 器 的 状态 ， 该 状态 由 在 语法 分 析 栈 顶 的 状态 符 代 表 ， 并 给 
出 下 一 个 输入 的 符号 〈 标 记 ) ， 语 法 分 析 表 就 会 指示 出 语法 分 析 器 所 应 该 执行 的 任务 。 语 法 分 析 
器 的 两 种 主要 动作 就 是 移 进 与 归 约 。 它 或 者 将 下 一 个 输入 符号 移 进 到 语法 分 析 栈 上 ， 或 者 已 经 
具有 了 在 栈 顶 的 句柄 ， 语 法 分 析 强 则 运用 一 条 RHS 与 句柄 相同 的 规则 ， 将 句柄 归 约 为 这 条 规则 
的 LHS。 语 法 分 析 器 还 可 能 具有 另外 两 种 行动 ， 其 一 为 接受 ， 即 语法 分 析 器 已 经 成 功 地 完成 了 
输入 的 语法 分 析 ， 其 二 则 为 报告 错误 ， 即 语法 分 析 器 发 现 了 一 个 语法 错误 。 

LR 语法 分 析 表 的 GOTO 部 分 的 行 以 状态 符 为 标号 ， 而 语法 分 析 表 中 这 一 部 分 的 列 则 以 非 终 
结 为 标号 。LR 语 法 分 析 表 的 GOTO 部 分 的 值 指 出 ， 在 归 约 完成 之 后 哪个 状态 符 应 该 被 推 到 语法 
分 析 栈 上 ， 这 也 就 意味 着 已 经 将 句柄 从 语法 分 析 栈 上 移 开 ， 并 且 已 经 将 新 的 非 终结 推 到 了 语法 
分 析 栈 上 。 当 将 句柄 以 及 相关 的 状态 符 从 栈 顶 移 走 之 后 ， 栈 顶 就 有 一 个 状态 符 。 以 这 个 状态 符 
为 行 标号 ， 就 可 以 在 表 的 GOTO 部 分 找到 要 进入 栈 的 状态 符 ， 而 这 个 状态 符 所 在 列 的 标号 就 是 
用 于 这 次 归 约 的 规则 中 的 LHS。 

考虑 下 面 算 术 表达 式 的 传统 文法 : 

L.E = E+T 

Zoe I 

es TSF 

4.T — F 

3.F (CE) 

6. F — 1d 

这 个 文法 规则 附 有 编号 ， 以 提供 在 语法 分 析 表 中 引用 它们 的 简单 方式 。 

图 4-5 显 示 了 这 个 文法 的 LR 语 法 分 析 表 。 请 注意 ， 在 这 里 我 们 使 用 了 动作 的 缩写 ， 并 且 使 
用 数字 来 表示 状态 。R4 意 味 着 使 用 第 4 个 规则 进行 归 约 ，S6 意 味 着 将 输入 的 下 一 个 符号 移 进 到 
栈 上 ， 并 将 第 6 个 状态 推 到 栈 上 。ACTION 表 中 的 空位 置 表示 语法 错误 。 在 一 个 完整 的 语法 分 析 
器 中 ， 这 里 就 应 该 出 现 对 错误 处 理 程序 的 调用 。 

使 用 把 文法 作为 输入 的 软件 工具 可 以 很 容易 地 构建 LR 语法 分 析 表 ， 例 如 yacc9 (Johnson,， 
1975)， 尽 管 LR 语法 分 析 表 能 手工 产生 ， 但 是 对 于 一 种 现实 程序 设计 语言 的 文法 来 说 ， 这 个 任 
务 是 漫长 的 、 乏 味 的 和 汤 洞 百出 的 。 在 实际 的 编译 器 中 ，LR 语 法 分 析 表 总 是 通过 软件 工具 来 
产生 。 

LR 语 法 分 析 器 的 初始 格局 为 


O yacc 是 “ 另 一 种 编译 绢 的 编译 器 ”(yet another compiler compiler) 之 英文 缩写 。 
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语法 分 析 器 动作 的 正规 定义 如 下 : 

1. 如 果 ACTION [S,,, a; ] = 移 进 $5， 则 下 一 个 格局 为 

(SoX S X83 XS AS, air ay ) 

移 进 过 程 十 分 简单 : 将 下 一 个 输入 符号 连同 一 个 状态 符号 一 起 推 到 栈 上 ， 这 个 状态 符 在 
ACTION 表 中 是 作为 移 进 部 分 的 说 明 。 

例如 ， 假 定 这 个 格局 是 (SoES!，+id…$)。ACTION 表 指定 S6 作 为 它 在 [1, +] 位 置 的 动作 。 
这 产生 了 格局 (SoES,+S,, id…$)。 

2. 如 果 ACTION[S, a] = 归 约 A 一 B 以 及 S=GOTO[S,_,,A]， 这 里 r = B 的 长 度 ， 则 下 一 个 
格局 为 

(SX Si XS "XSn_/AS, aj4j,1°77a,$ ) 

这 是 一 个 更 为 复杂 的 动作 。 为 了 归 约 ， 必 须 将 句柄 从 栈 里 移 走 。 因 为 栈 里 的 每 一 个 文法 符 
号 都 对 应 一 个 状态 符 ， 从 栈 里 移 走 的 符号 数目 是 句柄 中 符号 数目 的 两 倍 。 在 移 走 句柄 及 其 相关 
的 状态 符 之 后 ， 规 则 中 的 LHS 被 推 入 栈 中 。 最 后 ， 以 移 走 句柄 及 其 相关 的 状态 符 后 所 暴露 出 来 
的 符号 为 行 的 标号 ， 并 以 归 约 中 使 用 的 规则 里 LHS 的 非 终 结 为 列 的 标号 ， 进 而 查询 GOTO 表 。 
因而 在 新 的 格局 中 ， 栈 顶 的 符号 来 自 表 里 的 GOTO 部 分 ， 而 且 最 顶端 的 文法 符号 是 用 于 归 约 的 
规则 中 的 LHS, 

例如 ， 假 定 这 个 格局 是 (SoidS;，+id…$)。ACTION 表 在 [5，+] 位 置 上 指定 R6。 这 表示 使 用 
了 规则 6 归 约 〈E 一 id) 。 这 个 规则 的 RHS 有 1 的 长 度 ， 因 此 两 个 符号 必须 从 栈 中 弹出 。S。 就 出 现 
在 栈 的 顶部 ， 因 此 我 们 就 看 到 了 GOTO 表 的 0 行 F 列 (因为 F 是 用 在 归 约 规则 中 的 LHS)。 在 
GOTO 表 的 那个 位 置 ， 我 们 发 现 3， 因 此 在 把 F 压 入 栈 后 再 压 入 S;。 

3. 如 采 ACTION[S, a] = 接受 ， 则 语法 分 析 已 经 完成 ， 并 且 没 有 发 现 错误 。 

4. 如 用 ACTION[Sw al] = 错误 ， 语 法 分 析 器 此 时 就 会 调用 一 个 错误 处 理 程序 。 

尽管 存在 许多 基于 LR 概念 的 语法 分 析 算 法 ， 但 它们 之 间 的 差别 仅仅 是 语法 分 析 表 的 构造 。 
所 有 的 LR 语法 分 析 器 都 使 用 相同 的 语法 分 析 算 法 。 

也 证， 熟悉 LR 语法 分 析 过 程 的 最 好 方法 是 使 用 实际 的 例子 。 初 始 时 ， 语 法 分 析 栈 中 只 有 单 
个 符号 0， 代 表 语 法 分 析 器 的 0 状态 。 而 输入 则 包括 将 一 个 尾部 标记 附 于 右 端 结尾 处 的 输入 串 ， 
在 我 们 的 这 个 情形 中 尾 标 是 “$” 符 号 。 语 法 分 析 器 动作 的 每 一 个 步骤 都 由 栈 顶 的 符号 (图 4-4 
PRAMIS) 以 及 下 一 个 输入 标记 (图 4-4 中 最 左 端的 标记 ) 来 指导 。 正 确 的 动作 取 自 语法 
分 析 表 中 ACTION 部 分 相对 应 的 单元 。 而 语法 分 析 表 中 GOTO 部 分 则 在 归 约 动作 之 后 才 采 用 。 
前 面 讲 过 ， 表 的 GOTO 部 分 是 用 来 决定 在 一 个 归 约 动作 之 后 ， 应 该 将 哪个 状态 符 放 置 于 语法 分 
析 栈 上 。 

下 面 古 运 用 LR 语法 分 析 算 法 以 及 图 4-5 中 的 语法 分 析 表 来 跟踪 字符 串 id + id * id 的 语法 分 析 。 





栈 输入 动作 
0 id + id * id$ 移 进 5 
0id5 + id * id$ 归 约 6 (使 用 GOTO[0,，F]) 
OF3 + id * id$ 归 约 4 ({EĦ GOTO[O, T]) 
0T2 + id * id$ 归 约 2 (使 用 GOTO[0,，E]) 
OE!] + id * id$ 移 进 6 
0E1+6 id * id$ 移 进 5$ 
0E1+6id5 * id$ 归 约 6 (使 用 GOTO[6, F]) 
0E1+6F3 * id$ 归 约 4 〈 使 用 GOTO[6，T]) 


CC 


(2%) 


栈 输入 动作 
0E1+6T9 * id$ 移 进 7 
0E1+6T9*7 id$ 移 进 5 
0E1+6T9*7id5 $ 归 约 6 (使 用 GOTO[7，F] ) 
0E1+6T9*7F10 $ 归 约 3 (使 用 GOTO[6, T]) 
0E1+6T9 BE 归 约 1 (使 用 GOTO[0,，E]) 
0El $ 接受 


ass as ee 的 
Ca ee ee 
rt ee ENES 


RS | 





图 4-5 一 个 算术 表达 式 文 法 的 LR 语法 分 析 表 


Aho 等 人 的 文献 (Aho et al., 1986) 描述 了 从 给 定 文法 产生 LR 语法 分 析 表 的 一 些 算法 。 这 
些 算法 并 不 是 很 复杂 ， 但 它 超 出 了 程序 设计 语言 类 书籍 的 讲述 范围 。 正 如 前 面 提 到 的 ， 有 许多 
可 用 来 产生 LR 语法 分 析 表 的 软件 系统 。 


小 结 


无 论 使 用 什么 样 的 实现 方式 ， 语 法 分 析 是 所 有 语言 实现 中 的 共有 部 分 。 语 法 分 析 通 常 是 基于 被 实现 
语言 的 形式 语法 描述 。 最 常用 的 语法 描述 机 制 是 上 下 文 无 关 文法 ， 也 称 为 BNF。 语 法 分 析 的 任务 通常 被 
分 为 两 个 部 分 ， 即 词法 分 析 部 分 以 及 语法 分 析 部 分 。 将 词法 分 析 分 离 出 来 有 几 个 重要 理由 ， 它 们 是 简单 化 、 
高 效率 以 及 可 移植 性 。 

词法 分 析 绒 就 是 一 个 模式 匹配 器 ， 它 从 程序 中 将 称 为 词素 的 部 分 分 离 出 来 。 词 素 的 类 别 有 整 数字 面 
常量 和 名 字 。 这 些 种 类 也 被 称 为 标记 。 对 于 每 一 个 标记 分 配 一 个 数值 码 ， 词 法 分 析 器 在 识别 词素 的 同时 也 
产生 这 种 数值 码 。 构 造 词法 分 析 器 有 三 种 不 同 的 方式 : 其 一 ， 使 用 软件 工具 为 表 驱 动 分 析 器 来 产生 一 个 表 
格 ， 其 一 ， 手 工 建造 这 样 的 表格 ， 甚 三， 编写 代码 来 产生 被 实现 语言 标记 的 一 个 状态 图 描述 。 如 果 是 使 用 
字符 类 来 决定 状态 的 转换 ， 而 不 是 使 用 来 自 每 个 状态 节点 的 可 能 的 字符 来 决定 状态 的 转换 ， 那 么 标记 的 状 
态 图 就 可 能 相应 地 小 些 。 另 外 ， 使 用 表 的 查询 来 识别 保留 字 ， 可 以 简化 状态 图 。 

语法 分 析 器 具有 两 个 目的 : 即 ， 在 给 定 的 程序 中 发 现 语法 错误 ， 以 及 产生 语法 分 析 树 ;或 者 是 ， 对 
于 给 定 的 程序 产生 构造 语法 分 析 树 所 必需 的 信息 。 语 法 分 析 器 可 以 是 自 顶 向 下 的 (这 意味 着 它们 构造 最 左 
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派生 ， 按 自 顶 向 下 的 顺序 产生 语法 分 析 树 ) 或 者 自 底 向 上 的 在 此 情形 中 它们 构造 最 右派 生 的 逆向 ， 按 目 
底 向 上 的 顺序 产生 语法 分 析 树 )。 用 于 所 有 非 歧义 性 文法 的 语法 分 析 器 ， 复 杂 性 为 O (天 )。 然 而 ， 为 程序 设 
计 语 言 实现 语法 分 析 如 并 且 用 于 处 理 非 卜 义 性 文法 的 子 类 的 语法 分 析 细 ， 就 具有 复杂 性 O (n). 

递归 下 降 语法 分 析 器 是 LL 语法 分 析 如 ， 它 的 实现 是 通过 直接 从 源 语 言 文 法 来 编写 代码 。EBNF 作为 
递归 下 降 语法 分 析 器 的 基础 是 十 分 理想 的 。 递 归 下 降 语 法 分 析 器 中 ， 对 于 文法 中 的 每 一 个 非 终 结 都 有 一 个 
对 应 的 子 程序 。 如 果 所 给 定 的 一 条 文法 规则 只 有 单个 RHS， 那 么 这 条 规则 的 代码 就 很 简单 。 对 RHS 进 行 的 
检测 是 从 左 至 右 。 对 于 每 一 个 非 终结 ， 这 种 代码 都 将 调用 与 这 个 非 终 结 相 关联 的 子 程序 ， 而 该 子 程序 又 将 
对 非 终 结 产生 的 内 容 进 行 语法 分 析 。 对 于 每 一 个 终结 符 ， 这 种 代码 将 这 个 终结 符 与 下 一 个 输入 标记 进行 比 
较 ， 如 末 它 们 匹配 ， 这 段 代码 将 只 调用 词法 分 析 器 来 得 到 下 一 个 标记 ， 如 果 它 们 不 相 匹 配 ， 子 程序 将 报告 
一 个 语法 错误 。 如 采 一 条 规则 具有 多 个 RHS ， 该 子 程序 则 必须 首先 确定 应 该 对 哪个 RHS 进 行 语法 分 析 。 它 
必须 能 够 基于 下 一 个 输入 的 标记 来 做 出 这 项 决定 。 

有 两 个 不 同 的 文法 特征 妨碍 构造 基于 文法 的 递归 下 降 语法 分 析 器 ， 其 中 之 一 就 是 左 递归 。 从 文法 中 
消除 直接 左 递 归 的 过 程 是 相对 简单 的 。 有 一 种 算法 能 够 从 文法 中 删除 直接 和 间接 的 左 递归 ， 然 而 我 们 不 会 
在 书 中 讨论 这 种 算法 。 另 一 个 则 是 进行 成 对 不 相交 测试 ， 这 种 测试 能 够 判断 一 个 语法 分 析 的 子 程序 能 否 基 
于 下 一 个 输入 标记 来 确定 应 该 对 哪个 RHS 进 行 语法 分 析 。 运用 提取 左 因子 的 方法 能 够 对 一 些 文法 进行 修改 ， 
以 使 得 这 些 文法 能 够 通过 成 对 不 相交 测试 。 

目 底 站 上 语法 分 析 器 的 语法 分 析 问 题 是 要 找到 当前 句 型 的 子 串 ， 必 须 将 这 个 子 串 归 约 到 与 之 相关 的 
LHS， 以 便 在 最 右派 生 中 获得 下 一 个 (先前 的 ) 句 型 。 这 种 子 串 被 称 为 句 型 的 句柄 。 能 够 使 用 语法 分 析 树 
来 澄清 句柄 的 定义 。 自 底 向 上 语法 分 析 器 是 一 种 移 进 - 归 约 算法 ， 因 为 这 种 语法 分 析 器 在 大 多 数 情况 下 ， 
或 者 是 将 下 一 个 输入 的 词素 移 进 到 语法 分 析 栈 上 ， 或 者 是 归 约 位 于 栈 顶 的 句柄 。 

移 进 一 归 约 语 法 分 析 器 的 LR 家 族 是 程序 设计 语言 中 最 普遍 运用 的 自 底 向 上 语法 分 析 的 方式 ， 因 为 LR 
家 族 中 的 语法 分 析 器 比 其 他 方式 更 具 优 越 性 。LR 语 法 分 析 器 使 用 语法 分 析 栈 ， 这 种 语法 分 析 栈 包 括 文法 
从 号 和 状态 符号 ， 以 保持 语法 分 析 器 的 状态 。 在 语法 分 析 栈 顶 的 符号 总 是 一 个 状态 符 ， 它 代表 了 语法 分 析 
栈 与 语法 分 析 过 程 相 关 的 所 有 信息 。LR 语 法 分 析 器 使 用 两 种 语法 分 析 表 ， 即 ACTION 表 和 GOTO 表 。 
ACTION 表 说 明 在 给 出 了 语法 分 析 栈 顶 的 状态 符 以 及 下 一 个 输入 标记 之 后 ， 语 法 分 析 器 所 应 该 执行 的 任务 。 
GOTO 表 则 被 用 来 决定 在 归 约 完成 之 后 应 该 将 哪个 状态 符 放 置 于 语法 分 析 栈 上 。 


复习 题 


语法 分 析 右 以 文法 为 基础 的 三 个 理由 是 什么 ? 

给 出 词法 分 析 与 语法 分 析 分 离开 来 的 三 个 理由 。 

.给 出 词素 与 标记 的 定义 。 

词法 分 析 器 的 主要 任务 是 什么 ? 

5. 简略 描述 建造 一 个 词法 分 析 器 的 三 种 方法 。 

6. 什么 是 状态 转换 图 ? 

7. 为 什么 词法 分 析 器 状态 图 的 转换 使 用 字符 类 而 不 使 用 单个 字符 ? 

8. 语法 分 析 有 哪 两 个 不 同 的 目标 ? 

9. 描述 上 自 顶 向 下 和 自 底 向 上 两 种 语法 分 析 器 之 间 的 差别 。 

10. 描述 自 顶 向 下 语法 分 析 器 的 语法 分 析 问 题 。 

11. 摘 述 自 底 向 上 语法 分 析 器 的 语法 分 析 问 题 。 

12. 解释 编译 器 使 用 的 语法 分 析 算 法 为 什么 只 能 作用 于 所 有 文法 的 一 个 子 集 。 
13. 为 什么 标记 的 代码 使 用 命名 常量 而 不 使 用 数字 ? 

14. 摘 述 对 一 条 具有 单个 RHS 的 语法 规则 ， 如 何 编写 递归 下 降 语 法 分 析 子 程序 。 
15. 文 法 的 哪 两 个 特征 阻碍 了 这 种 文法 被 用 作 自 顶 向 下 语法 分 析 器 的 基础 ?请 给 出 解释 。 
16. 什么 是 给 定 文法 和 名 型 的 FIRST 集 合 ? 
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17. 描述 成 对 不 相交 测试 。 
18. 什么 是 提取 左 因子 ? 


19. 什么 是 句 型 的 短语 ? 2 
20. 什么 是 句 型 的 简单 短语 ? 
21. 什么 是 句 型 的 句柄 ? 
22. 自 顶 向 下 以 及 自 底 向 上 这 两 种 语法 分 析 器 是 基于 什么 数学 机 器 ? 
23. 描述 LR 语法 分 析 器 的 三 大 优点 。 
24. 在 开发 LR 语法 分 析 技 术 中 ，Knuth 的 见解 是 什么 ? 
25. 描述 LR 语法 分 析 器 中 ACTION 表 的 目的 。 
26. 描述 LR 语法 分 析 器 中 GOTO 表 的 目的 。 
27. 对 于 LR 语法 分 析 器 ， 左 递归 是 一 个 问题 吗 ? 
练习 题 
1. 对 下 面 的 文法 规则 进行 成 对 不 相交 测试 。 
a.A 一 aBlblcBB 
b.B 一 aBlbAlaBb 
c.C — aaA Ib I| caB 
2. 对 下 面 的 文法 规则 进行 成 对 不 相交 测试 。 
a. S — aSb | bAA 
b. A — b{aB} la 
c.B— aBla 
3. 使 用 第 4.4.1 市 中 的 递归 下 降 语 法 分 析 器 分 析 字 符 电 a+b*c， 并 且 写 出 对 于 语法 分 析 的 跟踪 。 
4. 使 用 第 4.4.1 中 的 递归 下 降 语 法 分 析 器 分 析 字 符 串 ax (b + c )， 并 且 写 出 对 于 语法 分 析 的 跟踪 。 
5. 使 用 下 面 给 出 的 文法 ， 给 每 一 个 右 句 型 画 出 一 棵 语法 分 析 树 ， 并 且 表 示 出 短语 、 简 单 短 语 以 及 句柄 。 
S — aAb | bÞBA A —> ablaAB B — aB Ib 
a. aaAbb 
b. bBab 
c. aaAbBb 
6. 使 用 下 面 给 出 的 文法 ， 给 每 一 个 右 句 型 画 出 一 棵 语法 分 析 树 ， 并 且 表 示 出 短语 、 简 单 短语 以 及 句柄 。 
S — AbB I bAc A —> Ab | aBB B —> Ac |I cBblIc 
a. aAcccbbe 
b. AbcaBccb 
c. baBcBbbec 198 


7. 对 于 串 id * (id + id) ， 使 用 第 4.5.3 节 中 的 文法 和 语法 分 析 表 显示 完整 的 语法 分 析 ， 包 括 语法 分 析 栈 的 
内 容 、 输 入 字符 串 以 及 动作 。 

8. 对 于 串 (id + id) * 这 ， 使 用 第 4.5.3 节 中 的 文法 和 语法 分 析 表 显示 完整 的 语法 分 析 ， 包 括 语 法 分 析 栈 的 
内 容 、 输 入 字符 串 以 及 动作 。 

9. 写 出 一 条 EBNF 规 则 来 描述 Java 或 C++ 语言 中 的 while 语 句 ， 并 且 使 用 Java 或 C++ 写 出 这 条 规则 的 递归 下 
降 子 程序 。 

10. 写 出 一 条 EBNF 规 则 来 描述 Java 或 C++ 语言 中 的 for 语 句 ， 并 且 使 用 Java 或 C++ 写 出 这 条 规则 的 递归 下 降 
子 程序 。 


程序 设计 练习 题 
L. 设计 一 个 状态 图 来 识别 基于 C 的 程序 设计 语言 的 一 种 注释 形式 ， 这 种 注释 开始 于 *， 结 束 于 */。 
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2. 设计 一 个 状态 图 来 识别 你 所 喜欢 的 程序 设计 语言 中 的 浮 点 字面 常量 。 

3. 编写 并 剖 试 程序 设计 练习 题 1 中 状态 图 的 实现 代码 。 

4. 编写 并 测试 程序 设计 练习 题 2 中 状态 图 的 实现 代码 。 

5. 使 用 Java 语 言 来 改写 4.2 市 中 的 词法 分 析 器 (原来 是 用 C 编 写 的 )。 

6. 对 于 能 够 通过 练习 题 1 中 测试 的 那些 规则 编写 一 个 递归 下 降 语 法 分 析 子 程序 ， 来 对 这 些 规 则 产生 的 语言 
进行 语法 分 析 。 假 设 ， 你 有 一 个 被 命名 为 lex 的 词法 分 析 器 以 及 一 个 被 命名 为 error 的 错误 处 理子 程序 ， 
当 检 测 到 语法 错误 时 ， 则 调用 错误 处 理子 程序 。 

7. 对 于 能 够 通过 练习 题 2 中 测试 的 那些 规则 编写 一 个 递归 下 降 语法 分 析 子 程序 ， 来 对 这 些 规则 产生 的 语言 
进行 语法 分 析 。 假 设 ， 你 有 一 个 被 命名 为 lex 的 词法 分 析 器 以 及 一 个 被 命名 为 error 的 错误 处 理子 程序 ， 
当 检 测 到 语法 错误 时 ， 则 调用 错误 处 理子 程序 。 

8. 实现 并 且 测 试 在 4.5.3 市 中 给 出 的 LR 语法 分 析 算 法 。 


第 5 章 ”名字 、 绑 定 、 类 型 检测 和 作用 域 


本 章 介绍 变量 的 基本 语义 问题 。 我 们 将 首先 讨论 这 些 题目 中 最 基本 的 课题 ， 即 程序 设计 语 
言 中 名 字 及 特殊 字 的 性 质 。 然 后 讨论 变量 的 属性 ， 包 括 变量 类 型 、 变 量 地 址 和 变量 值 。 别 名 问 
题 也 包括 在 讨论 之 中 。 接 着 再 介绍 绑 定 和 绑 定时 间 的 重要 概念 。 由 于 对 变量 属性 所 具有 的 可 能 
不 同 的 绑 定时 间 ， 从 而 定义 出 了 四 种 不 同 的 变量 类 型 。 在 描述 了 这 四 种 变量 类 型 之 后 ， 是 对 于 
类 型 检测 、 强 类 型 化 以 及 类 型 兼容 规则 的 深入 研究 。 两 种 不 同名 字 的 作用 域 规 则 ， 即 静态 与 动 
态 的 作用 域 ， 将 与 语句 引用 环境 的 概念 一 起 讨论 。 最 后 将 讨论 命名 常量 以 及 变量 的 初始 化 。 


5.1 概述 


在 不 同 的 程度 上 ， 命 令 式 程序 设计 语言 是 冯 “' 诺 依 曼 计 算 机 体系 结构 的 抽象 。 计 算 机 体系 
结构 中 的 两 个 主要 组 成 部 分 为 :存储 器 一 一 存储 指令 与 数据 ， 处 理 器 一 一 提供 修改 存储 器 内 容 
的 一 些 操作 。 变 量 是 机 器 存储 单元 在 语言 中 的 抽象 。 在 某 些 情况 下 ， 这 种 抽象 的 特征 非常 接近 
存储 单元 的 特征 ; 整数 变量 就 是 一 个 例子 ， 整 数 变 量 通 常 完 全 由 单个 或 多 个 硬件 存储 字 节 来 代 
表 。 而 在 其 他 的 情况 下 ， 这 种 抽象 又 与 硬件 存储 单元 相去 其 远 ， 例 如 一 个 三 维 数组 的 情形 ， 则 
要 求 一 个 软件 映射 函数 来 支持 这 种 抽象 。 

变量 可 以 由 一 组 性 质 或 属性 来 概括 ， 在 这 些 属性 中 最 重要 的 就 是 类 型 ， 它 是 程序 设计 语言 
的 一 项 基本 概念 。 一 种 语言 的 数据 类 型 设计 需要 考虑 多 种 因素 (数据 类 型 将 在 第 6 章 中 讨论 )， 
其 中 最 重要 的 因素 是 变量 的 作用 域 以 及 生存 期 。 与 这 两 个 因素 相关 联 的 是 变量 的 类 型 检测 以 及 
变量 的 初始 化 问题 。 类 型 兼容 是 语言 数据 类 型 设计 中 的 另 一 个 重要 部 分 。 

所 有 这 些 概念 对 于 理解 命令 式 语 言 十 分 必要 。 

在 本 书 的 余下 部 分 ， 我 们 时 常会 以 引述 一 种 语言 的 方式 来 引述 该 语言 的 家 族 。 例 如 ， 当 提 
及 Fortran 时 ， 我 们 指 的 是 Fortran 语 言 的 所 有 版 本 ， 这 同样 也 适用 于 引述 Ada 时 的 情形 ， 当 引述 C 
语言 时 ， 包 括 C 的 原始 版 本 以 及 C89 和 C99 版 本 。 我 们 用 “基于 C 的 语言 ”来 指 C、C++、Javal 人 
及 C# 语 言 。” 如 果 我 们 特别 地 引述 一 种 语言 的 某 个 特定 版 本 时 ， 这 是 因为 就 我 们 所 讨论 的 课题 
而 言 ， 它 与 该 语言 家 族 的 其 他 成 员 不 同 。 


5.2 ZF 


在 开始 关于 变量 的 讨论 之 前 ， 我 们 必须 讨论 变量 的 一 个 基本 属性 一 一 名 字 。 名 字 不 只 是 用 
于 变量 ， 它 具有 更 广泛 的 用 途 。 名 字 也 与 标号 、 子 程序 、 形 参 以 及 其 他 程序 结构 相关 联 。 标 识 
从 当当 与 名 字 一 词 互 换 使 用 。 


5.2.1 设计 问题 


下 面 是 关于 名 字 的 主要 设计 问题 : 
。 名 字 是 否 大 小 写 敏 感 ? 
。 特 殊 字 究竟 是 保留 字 还 是 关键 字 ” 


O 我们 试图 包括 脚本 语言 JavaScript 和 PHP 作 为 基于 C 的 语言 ， 但 是 与 它们 的 祖先 相 比 ， 它 们 显得 难 了 点 。 
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这 些 问 题 将 在 下 面 的 两 节 中 讨论 ， 这 两 节 也 包括 了 一 些 设计 选择 的 例子 。 


5.2.2 ”名字 形式 


名 字 是 用 来 标识 程序 中 某 些 实体 的 字符 串 。 
Fortran95 人 允许 在 一 个 名 字 中 有 多 达 31 字 符 的 名 字 。 

和 由 全 人 合计 二 全 月。 C89 对 于 它 的 内 部 名 字 没 有 长 度 的 限制 ， 但 名 字 中 只 有 前 
31 个 字符 具有 意义 。C99 类 似 于 C89， 但 它 的 名 字 中 前 63 个 
a a ete 字符 具有 意义 。 在 C89 中 ， 外 部 名 字 (那些 定义 于 函数 之 
EAA Riedie toy IM 必须 使 用 语言 链接 器 来 处 理 的 名 字 ) 被 限制 为 6 个 字符 ， 
ee ee 而 在 C99 中 ， 这 种 限制 增加 到 了 31 个 字符 。 名 字 在 Java、 

Fortran 1 打破 了 使 用 童 个 字 ”C# 以 及 Ada 中 都 没有 长 度 限制 ， 并 且 这 些 语言 的 名 字 中 所 
符 名 字 的 传统 ， 它 允许 名 字 使 用 ”有 字符 都 是 具有 意义 的 。 然 而 ，Ada 语 言 的 实现 允许 施加 
多 至 6 个 字符 。 而 Fortran 77 仍 然 一 种 长 度 限制 ,但 这 种 限制 是 不 少 于 200 个 字符 ， 显 然 ， 这 
将 名 字 限 制 于 6 个 字符 。 种 限制 并 不 令 人 讨厌 。C++ 不 指明 名 字 的 长 度 限制 ， 但 有 

些 时 候 ， 语 言 的 实现 人 员 会 施加 某 种 限制 ， 这 样 做 是 为 了 
使 编译 期 间 存储 标识 符 的 符号 表 不 至 于 太 大 ， 并 且 还 可 以 简化 符号 表 的 维护 工作 ， 

在 大 多 数 程序 设计 语言 中 ， 名 字 具 有 相同 的 形式 : 一 个 字母 后 跟 一 个 包含 字母 、 数 字 以 及 
下 划 线 (_) 的 字符 串 。 在 20 世 纪 70 年 代 及 80 年 代 ， 包 括 下 划 线 的 名 字 使 用 得 很 广泛 ， 但 这 种 用 
法 现在 已 经 很 少 了 。 在 基于 C 的 语言 中 , 下划线 已 经 在 很 大 程度 上 被 “骆驼 ”形式 的 标记 所 取代 。 
所 谓 “骆驼 ”形式 ， 就 是 在 一 个 多 单词 的 名 字 中 ， 第 二 个 单词 的 第 一 个 字母 用 大 写 ， 例 如 

myStack。e 注意， 在 名 字 中 使 用 下 划 线 和 混合 大 小 写 是 


03 历史 注释 程序 设计 风格 问题 ， 不 是 语言 设计 问题 。 


在 Fortran90 之 前 的 版 本 中 ， 在 Fortran 90 之 前 的 各 种 Fortran 版 本 中 ， 名 字 的 中 间 可 
只 有 大 写字 母 可 以 用 于 名 字 , 这 以 代入 空格 ， 而 这 些 空格 将 会 被 忽略 。 例 如 ， 下 面 的 这 两 
是 一 种 不 必要 的 限制 。 这 种 限制 个 名 字 就 是 等 价 的 : 
源 于 当时 的 卡片 打 洞 机 只 有 大 写 
= Æ , & Fortran 90— # , 


Fortran 77 的 多 种 实现 都 允许 小 TAPAEA sika iik ii 
人 在 许多 语言 中 ， 尤 其 是 在 基于 C 的 语言 中 ， 名 字 中 的 大 


写字 母 翻 译 成 大 写字 母 来 供 机 器 ”写字 母 与 小 写字 母 是 有 区 别 的 ， 也 就 是 说 ， 在 这 些 语言 中 
内 部 使 用 。 的 名 字 是 大 小 写 敏感 的 。 例 如 ， 在 C++ 中 ， 下 面 的 这 三 个 
名 字 是 不 同 的 : rose，ROSE，Rose。 在 一 些 人 看 来 ， 这 严 
重地 损失 了 语言 的 可 读 性 ， 因 为 看 上 去 十 分 相像 的 名 字 实 际 上 却 表 示 不 同 的 实体 。 从 这 种 音义 
上 来 说 ， 大 小 写 敏感 违反 了 语言 构造 的 基本 设计 原则 ， 这 个 原则 要 求 ， 看 似 一 样 的 事物 应 该 具 
有 相同 的 意义 。 对 于 变量 名 不 区 分 大 小 写 的 程序 设计 语言 来 说 ， 虽然 Rose 和 rose 看 起 来 很 接近 ， 
但 事实 上 一 点 联系 也 没有 。 
显然 ， 并 不 是 每 个 人 都 认为 名 字 大 小 写 敏感 是 一 件 坏事 。 在 C 语 言 中 ， 大 小 写 敏 感 的 问题 
通过 只 在 名 字 中 使 用 小 写字 母 而 得 以 避免 ， 然 而 在 Java 和 C# 中 ， 这 个 问题 就 不 能 够 避免 ， 因 为 
许多 预定 义 的 名 字 包 括 了 大 写字 母 和 小 写字 母 。 例 如 ，Java 中 将 一 个 字符 串 转 换 成 整数 值 的 方 
法 是 parseInt， 如 果 将 其 拼写 为 ParseInt 或 者 parseint， 就 不 能 够 被 识别 。 这 是 可 写 性 的 


Sum Of Salaries 
SumOfSalaries 


O 之 所 以 被 称 为 “骆驼 ， 是 因为 用 这 种 形式 写 出 来 的 字 常 常 在 中 间 典 入 了 大 写字 母 ， 看 起 来 就 像 是 骆驼 的 峰 。 
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问题 ， 而 不 古 可 读 性 的 问题 ， 因 为 要 记 住 独特 的 拼 字 方法 会 使 正确 编写 程序 更 困难 。 这 是 由 编 
译 缘 强制 的 ， 是 对 部 分 语言 的 设计 人 员 的 某 种 严 律 性 。 


5.2.3 特殊 字 


程序 设计 语言 中 的 特殊 字 用 于 对 所 要 进行 的 操作 命名 ， 从 而 使 得 程序 的 可 读 性 更 好 。 特 殊 
字 也 用 来 分 离 程序 中 的 语法 实体 。 大 多 数 语言 将 特殊 字 归 为 保留 字 ， 但 在 某 些 语 言 中 它们 仅仅 
是 关键 字 。 

关键 字 是 程序 设计 语言 中 的 一 种 字 ， 它 只 在 特定 的 上 下 文 里 是 特殊 的 。Fortran 语 言 中 的 特 
殊 字 就 是 关键 字 。 在 Fortran 中 ， 当 字 Real 出 现 于 语句 的 开头 ， 并 且 后 面 跟随 一 个 名 字 时 ， 就 认 
为 它 是 一 个 关键 字 ， 它 示意 这 条 语句 是 一 条 声明 语句 。 但 如 果 在 Real 的 后 面 跟随 一 个 赋值 操作 
件 ， 则 认为 它 是 一 个 变量 名 。 下 面 举 例 来 说 明 这 两 种 不 同 的 用 法 : 


Real Apple 
Real = 3.4 


Fortran 编 译名 以 及 Fortran 程 序 的 读者 必须 通过 上 下 文 来 识别 这 种 名 字 与 特殊 字 之 间 的 差别 。 
保留 字 是 程序 设计 语言 中 的 特殊 字 ， 它 不 能 用 作 名 字 。 作 为 语言 设计 的 选择 ， 保 留 字 比 关 
健 字 优越 ， 因 为 重新 定义 关键 字 的 功能 会 导致 混淆 。 例 如 ， 在 Fortran 中 ， 可 以 有 下 面 的 语句 ， 


Integer Real 
Real Integer 


这 里 声明 程序 变量 Real 为 整数 (Integer) 类 型 ， 而 变量 Integer 为 实数 (Real) 类 型 。9 
除了 这 两 条 声明 语句 的 奇异 外 表 之 外 ，Integer 和 Real 作 为 变量 名 出 现在 程序 中 其 他 部 分 ， 
会 给 程序 读者 以 误导 。 

保留 字 有 个 潜在 的 问题 ， 如 果 语 言 包含 了 大 量 的 保留 字 ， 用 户 很 难 确定 名 字 不 是 保留 的 。 关 
于 这 个 问题 ， 最 好 的 例子 是 COBOL， 它 有 300 个 保留 字 。 不 幸 的 是 ， 程 序 员 最 常用 到 的 一 些 名 宁 
出 现在 保留 字 列 表 中 ， 例 如 ，LENGTH BOTTOM DESTINATION 和 和 COUNT, 

一 些 语言 包括 了 预定 义 的 名 字 ， 在 某 种 意义 上 ， 这 种 名 字 位 于 保留 字 与 用 户 定义 名 字 之 间 。 
它们 既 具 有 预定 义 的 含义 ， 又 能 够 被 用 户 重新 定义 。 例如 ，Ada 中 内 置 数据 类 型 的 名 字 (如 
Integer 和 Float) 都 是 预定 义 的 。 这 些 名 字 不 是 被 保留 的 ， 任 何 Ada 程 序 都 能 够 将 其 重新 定义 。 

在 大 多 数 语言 中 ， 在 其 他 程序 单元 中 ， 如 Ada 和 Java 语 言 中 的 包 以 及 C 和 C++ 语言 中 的 库 ， 
定义 的 名 字 只 对 某 一 个 程序 可 见 。 它 们 是 预定 义 的 名 字 ， 但 必须 在 显 式 导入 之 后 才 可 见 ， 而 _- 
且 寻 和 之后， 这 些 名 字 就 不 能 再 被 定义 。 


5.3 变量 


程序 的 变量 是 计算 机 的 存储 单元 或 对 计算 机 一 系列 存储 单元 的 抽象 。 程序 人 员 常 常 认为 变 
量 古 存储 地 址 的 名 字 ， 但 是 变量 比 仅 是 名 字 具 有 更 重大 的 意义 。 从 机 器 语言 到 汇编 语言 的 发 展 ， 
企 很 大 程度 上 是 用 名 字 赫 代 绝 对 数字 的 存储 地 址 的 发 展 ， 这 使 得 程序 可 读 性 更 好 ， 因 而 也 就 更 
容 匈 编写 和 维护 。 因 为 将 名 字 转 换 成 实际 地 址 的 翻译 器 也 选择 这 些 地 址 ， 所 以 这 一 步 回 避 了 缀 
对 地 址 的 问题 。 

可 以 使 用 6 种 属性 来 刻画 一 个 变量 ， 名字、 地 址 、 数 值 、 类 型 、 生 存 期 、 作 用 域 。 尽 管 这 对 
于 一 种 看 似 简单 的 概念 似乎 太 过 复杂 ， 但 正 是 这 6 种 属性 提供 了 一 种 最 清晰 的 方式 来 解释 变量 的 


O 当然， 任何 专 业 的 程序 人 员 若 编写 出 这 样 的 程序 ， 就 应 当 担 心 自己 的 饭碗 不 保 。 
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各 个 方面 。 

关于 变量 属性 的 讨论 将 会 导致 对 许多 相关 重要 概念 的 研究 ， 包 括 别 名 、 绑 定 、 绑 定时 间 、 
声明 、 类 型 检测 、 强 类 型 化 、 作 用 域 规则 以 及 引用 环境 。 

关于 变量 的 名 字 、 地 址 、 类 型 以 及 数值 ， 将 在 下 面 的 几 节 讨论 。 关 于 生存 期 与 作用 域 属性 ， 
将 在 5.4.3 节 和 5.8 节 分 别 讨论 。 


5.3.1 ZF 


变量 名 是 程序 中 最 常见 的 名 字 。 我 们 已 经 在 第 5.2 节 中 讨论 过 。 大 多 数 的 变量 具有 名 字 。 没 
有 名 字 的 变量 将 在 5.4.3.3 市 中 讨论 。 


5.3.2 地 址 


变量 的 地 址 是 与 这 个 变量 相关 联 的 存储 地 址 。 然 而 这 种 关联 关系 却 不 是 看 上 去 那么 简单 。 
在 许多 语言 中 ， 程 序 中 的 相同 名 字 可 以 在 不 同 的 时 间 ， 与 不 同 的 地 址 相关 联 。 例 如 ， 如 果子 程 
序 有 一 个 局 部 变量 〈 当 调用 子 程序 时 ， 它 从 远 行 时 栈 分 配 而 来 ) ， 不 同 的 调用 可 能 会 导致 变量 有 
不 同 的 地 址 。 从 某 种 意义 上 说 ， 它 们 是 同一 变量 的 不 同 实例 。 

变量 与 地 址 相关 联 的 过 程 将 在 第 5.4.3 节 中 进一步 讨论 。 有 关子 程序 以 及 子 程序 激活 的 一 个 


实现 模型 将 在 第 10 章 中 讨论 。 
有 了 时， 也 将 变量 地 址 称 为 变量 的 左 值 (1l-value)， 这 是 因为 变量 通常 位 于 赋值 语句 的 左边 。 
多 个 变量 可 以 具有 同一 个 地 址 。 当 用 多 个 变量 名 来 访 
回 单个 存储 地 址 时 ， 这 些 变量 名 就 称 为 别名 。 别 名 使 用 有 


Pontranse à P Equivalence 。 损 于 可 读 性 ， 因 为 它 允 许 通 过 给 一 个 变量 赋值 来 改变 另 -一 
BAAS ANENE GRAS. 个 变量 的 值 。 例 如 ， 如 果 变量 total 和 sum 为 别名 ，total 
Seer theme ge 的 任何 变化 就 会 改变 sum， 反 之 亦 然 。 程 序 的 读者 必须 时 刘 
| 记 住 total 和 sum 是 同一 个 存储 单元 的 不 同名 字 。 因 为 在 
并 加 上 现在 的 友信 空间 已 经 相对 一 个 程序 中 可 以 具有 数 个 别名 ， 所 以 实际 使 用 时 非常 困难 。 
+e Bammer em 别名 使 用 也 使 得 程序 的 验证 更 为 困难 。 


Equivalence 4), 22%, Fortran 在 程序 中 可 以 用 多 种 不 同 的 方式 产生 别名 。 在 C 和 C++ 
90 中 删除 了 Equivalence 语 向 。 语言 中 产生 别名 的 常用 方式 是 使 用 联合 (union) 类 型 。 关 


于 联合 ， 我 们 将 在 第 6 章 进行 深入 讨论 。 

指 癌 同 一 存储 地 址 的 两 个 指针 变量 也 是 别名 。 对 于 引用 变量 也 有 同样 的 情形 。 这 种 类 型 的 
别名 使 用 不 过 是 指针 与 引用 特性 的 一 种 副作用 。 设 定 一 个 Ct+ 指 针 来 指向 一 个 命名 变量 后 ， 当 
指针 被 间接 引用 时 ， 这 个 指针 以 及 变量 名 都 是 别名 。 

在 许多 语言 中 ， 通 过 子 程序 的 参数 也 可 以 产生 别名 使 用 。 关 于 这 种 类 型 的 别名 ， 我 们 将 在 
第 9 章 中 讨论 。 

变量 与 地 址 相关 联 的 时 间 对 于 理解 程序 设计 语言 是 非常 重要 的 。 关 于 这 个 题目 ， 将 在 第 
SAITE. 


5.3.3 类 型 


变量 的 类 型 决定 变量 可 以 存储 的 值 的 范围 ， 并 决定 为 这 种 类 型 的 值 所 定义 的 操作 集合 。 例 
如 Java 中 的 int 类 型 说 明 从 一 2 147 483 648 到 2 147 483 647 的 取 值 范围 ， 以 及 一 组 包括 加 法 、 减 
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法 、 乘 法 、 除 法 以 及 取 模 的 算术 运算 。 
5.3.4 值 


一 个 变量 的 值 是 与 这 个 变量 相关 联 的 存储 单元 的 内 容 。 我 们 可 以 很 方便 地 将 计算 机 的 存储 
器 设 想 成 抽象 的 单元 ， 而 非 物 理 的 单元 。 大 多 数 现代 的 计算 机 存储 单元 或 单个 地 址 单元 ， 是 以 
字 节 为 单位 的 ， 一 个 字 节 具有 八 个 位 长 度 。 对 于 大 多 数 的 程序 变量 ， 这 样 的 大 小 还 是 太 小 ， 因 
而 我 们 定义 一 种 抽象 的 存储 单元 ， 它 具有 相关 变量 所 需要 的 大 小 。 例 如 ， 虽 然 在 某 种 特定 语言 
的 特定 实现 中 ， 浮 点 数值 可 能 占据 四 个 物理 字 节 ， 但 我 们 可 以 设想 ， 一 个 浮 点 数值 只 占有 一 个 
抽象 存储 单元 。 我 们 也 可 以 认为 ， 每 一 个 简单 非 结构 类 型 的 值 只 占有 一 个 抽象 单元 。 自 此 往 后 ， 
,' 我 们 使 用 术语 存储 单元 时 ， 指 的 是 抽象 存储 单元 。 

变量 的 值 有 时 被 称 为 变量 的 右 值 (r-value)， 因 为 变量 被 用 于 赋值 语句 的 右边 时 ， 则 会 要 求 
这 种 变量 值 。 要 取得 右 值 必须 首先 确定 左 值 ， 获 得 这 种 确定 性 并 非 总 是 简单 的 。 例 如 ， 在 5.8 
将 要 讨论 的 作用 域 规则 会 使 情况 非常 复杂 。 


5.4 绑 定 的 概念 


在 一 般 的 意义 上 ， 绑 定 是 一 种 关联 ， 如 存在 于 属性 与 实体 之 间 的 关联 ， 或 者 操作 与 符号 之 间 
的 关联 。 绑 定 发 生 的 时 间 称 为 绑 定时 间 。 绑 定 和 绑 定时 间 是 程序 设计 语言 语义 中 的 重要 概念 。 绑 
定 可 以 发 生 在 语言 设计 时 、 语 言 实现 时 、 编 译 时 、 载 人 时 、 连 接 时 或 者 运行 时 。 例 如 ， 星 号 (*) 
通 前 在 语言 设计 时 与 乘法 操作 相 绑 定 。 一 种 数据 类 型 ， 如 C 语 言 中 的 int， 是 在 语言 实现 时 与 可 能 
的 取 值 范围 相 绑 定 的 。Java 程 序 中 的 变量 是 在 编译 时 被 绑 定 于 某 种 特定 的 数据 类 型 的 。 而 当 程序 被 
载 入 存储 器 时 ， 一 个 变量 与 一 个 存储 单元 相 绑 定 。 但 在 某 些 情况 下 ， 这 种 类 型 的 绑 定 直到 运行 时 
才 发 生 ， 如 在 Java 方 法 中 声明 的 变量 。 一 个 对 库 子 程序 的 调用 是 在 链接 时 与 该 子 程序 相 绑 定 的 。 

考虑 下 面 的 C 赋 值 语 句 : 

count = count + 5; 

对 于 这 条 赋值 语句 中 的 部 分 ， 其 绑 定 与 绑 定 时 间 如 下 所 示 ; 

e count HIRA. 绑 定 于 编译 时 。 

e count 的 可 能 取 值 集合 : 绑 定 于 编译 器 设计 时 。 

“操作 符 + 的 意义 : 绑 定 于 编译 过 程 中 ， 当 操作 数 的 类 型 被 确定 之 后 。 

* 字面 常 量 5 的 内 部 表示 : 绑 定 于 编译 器 设计 时 。 

count: 绑 定 于 这 条 语句 被 执行 时 。 

彻底 地 理解 程序 实体 属性 的 绑 定 时 间 是 理解 程序 设计 语言 语义 的 前 提 。 例 如 ， 要 理解 一 个 
于 程序 的 作用 ， 必 须 先 理解 子 程序 调用 中 的 实 参 是 怎样 与 子 程序 定义 中 的 形 参 相 绑 定 的 。 要 确 
定 一 个 变量 的 当前 值 ， 就 需要 知道 这 个 变量 是 在 什么 时 候 与 存储 单元 绑 定 的 . 


5.4.1 属性 与 变量 绑 定 


如 有 一 种 绑 定 的 第 一 次 出 现 是 在 运行 时 之 前 ， 并 且 在 整个 程序 的 执行 过 程 中 保持 不 变 ， 我 
们 称 这 种 绑 定 为 静态 的 。 如 果 一 种 绑 定 的 第 一 次 出 现 是 在 运行 时 期 间 ， 或 者 这 种 绑 定 可 以 在 程 
序 执行 中 被 改变 ， 我 们 称 这 种 绑 定 为 动态 的 。 在 虚拟 存储 器 环境 中 ， 变 量 与 存储 单元 的 物理 绑 
定 征 十 分 复杂 的 ， 因 为 存储 单元 所 在 的 地 址 空间 的 页 或 段 在 程序 的 执行 期 间 可 以 被 多 次 地 移 进 
与 移出 存储 器 。 在 某 种 意义 上 ， 这 些 变量 是 被 重复 地 绑 定 与 释放 。 然 而 这 些 绑 定 是 由 计算 机 硬 
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件 来 维持 的 ， 无 论 是 程序 还 是 用 户 都 感觉 不 到 这 些 变化 。 这 种 硬件 的 绑 定 不 是 我 们 关心 的 话题 。 
我 们 最 需要 了 解 的 是 区 分 静态 绑 定 与 动态 绑 定 。 


5.4.2 类 型 绑 定 


在 程序 中 引用 一 个 变量 之 前 ， 变 量 必须 被 绑 定 到 一 种 数据 类 型 之 上 。 这 种 绑 定 具 有 的 两 个 
重要 方面 是 指定 类 型 的 方式 以 及 绑 定 发 生 的 时 间 。 可 以 通过 一 些 显 式 或 者 隐 式 的 声明 来 静态 指 
定 变量 的 类 型 。 

5.4.2.1 静态 类 型 绑 定 

显 式 声 明 是 程序 中 的 一 条 说 明 语 句 ， 它 列 出 一 批 变量 名 并 指明 这 些 变量 的 特定 类 型 。 隐 式 
声明 则 是 通过 默认 协定 的 方法 而 不 是 声明 语句 将 变量 与 类 型 相关 联 。 在 隐 式 声明 的 情况 下 ， 变 
量 名 在 程序 中 的 第 一 次 出 现 即 构 成 了 它 的 隐 式 声明 。 显 式 声 明 与 隐 式 声明 都 产生 对 类 型 的 静态 
绑 定 。 

自 20 世 纪 60 年 代 中 期 以 来 设计 的 大 多 数 程序 设计 语言 ， 要 求 对 所 有 的 变量 都 予以 显 式 声 明 
(Perl、JavaScript 和 ML 是 这 些 语言 中 的 三 个 例外 ) 。 一 些 于 20 世 纪 60 年 代 末 期 开始 设计 的 广泛 应 
用 的 语言 ， 特 别 是 Fortran、PL/I 和 BASIC 语 言 中 都 具有 了 隐 式 声明 。 例 如 ， 在 Fortran 中 ， 一 个 
出 现 于 程序 中 但 没有 被 显 式 声明 的 标识 符 ， 是 根据 下 面 的 协定 来 隐 式 声明 的 :如果 一 个 标识 符 
以 字母 IT、J、K、 工 、M 或 者 N 开 始 ， 或 这 些 字母 的 小 写字 母 它 便 被 隐 式 地 声明 为 Integez 类 
型 ， 否 则 ， 它 就 被 声明 为 Real 类 型 。 

尽管 隐 式 声明 给 程序 人 员 带 来 了 些微 方便 ， 但 它 却 有 损 于 程序 的 可 靠 性 ， 因 为 它 有 碍 于 在 
编译 过 程 中 发 现 键 入 错误 以 及 程序 人 员 的 编程 错误 。Fortran 的 程序 人 员 不 经 意 漏 掉 声明 的 变量 
会 被 自动 地 给 予 默 认 类 型 和 一 些 未 曾 预 料 的 属性 ， 这 会 导致 出 现 难 以 诊断 的 微妙 错误 。 现 在 许 
多 Fortran 程 序 人 员 在 他 们 的 程序 中 包括 了 声明 : implicit none。 这 种 声明 指示 编译 器 不 要 
隐 式 地 声明 任何 变量 ， 因 而 避免 了 由 漏 掉 声明 的 变量 可 能 带 来 的 问题 。 

要 避免 隐 式 声明 带 来 的 问题 ， 还 可 以 通过 要 求 特殊 类 型 名 字 以 某 些 特殊 的 字符 开始 的 方式 。 
例如 ， 在 Perl 语 言 中 ， 任 何以 $ 开 始 的 名 字 都 是 一 个 标量 ， 它 能 够 存放 一 个 字符 串 或 者 数字 值 ; 
如 果 是 以 @ 开 始 的 名 字 ， 它 就 是 一 个 数组 ， 名 字 以 多 开 始 的 是 一 个 散 列 结构 。 以 这 种 方式 来 对 
不 同类 型 的 变量 产生 不 同 的 名 字 空 间 。 在 这 里 ， 名 字 @apple 与 名 字 %apple 是 无 关 的 ， 因 为 它们 
来 自 各 自 不 同 的 名 字 空 间 。 此 外 ， 程 序 的 读者 只 要 读 到 变量 名 ， 就 必定 知道 了 它 的 类 型 。 请 注 
意 ， 这 种 规定 与 Fortran 中 的 不 同 ， 因 为 Fortran 语 言 包 括 了 隐 式 及 显 式 两 种 声明 ， 因 而 从 变量 名 
的 拼 法 不 一 定 能 够 确定 一 个 变量 的 类 型 。 

5.4.2.3 玉 将 讨论 另 一 种 隐 式 类 型 绑 定 一 一 类 型 引用 。 

C 和 C++ 都 有 数据 声明 和 定义 。 声 明 用 来 说 明 类 型 以 及 其 他 属性 ， 并 不 引起 存储 空间 的 分 
配 。 定 义 则 说 明 属 性 ， 并 引起 存储 空间 的 分 配 。C 程 序 对 于 某 一 给 定 的 名 字 可 以 有 任意 数目 相 
互 兼容 的 声明 ， 但 是 只 有 一 个 定义 。C 语 言 中 变量 声明 的 一 个 目的 是 为 在 函数 外 部 定义 但 在 函 
数 内 部 使 用 的 变量 提供 类 型 信息 。 这 种 思想 也 被 用 于 C 和 C++ 的 函数 中 ， 函 数 原 型 声明 函数 名 
字 以 及 接口 ， 但 是 没有 包括 函数 的 代码 。 而 函数 的 定义 则 完整 地 定义 了 所 有 这 些 内 容 。 

5.4.2.2 动态 类 型 绑 定 

在 使 用 动态 类 型 绑 定时 ， 变 量 的 类 型 不 是 由 声明 语句 来 说 明 的 ， 也 不 能 够 通过 名 字 的 拼 法 
来 确定 ， 而 是 在 赋值 语句 给 变量 赋值 时 ， 变 量 才 与 类 型 相 绑 定 。 在 执行 赋值 语句 时 ， 被 赋值 的 
变量 与 赋值 语句 右边 的 表达 式 的 值 的 类 型 相 绑 定 。 

具有 动态 类 型 绑 定 的 语言 与 那些 只 有 静态 类 型 绑 定 的 语言 有 很 大 不 同 。 变 量 与 类 型 动态 绑 
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定 的 主要 优越 性 在 于 给 程序 设计 提供 了 极 大 的 灵活 性 。 例 如 ， 在 一 种 使 用 动态 类 型 绑 定 的 语言 
中 ， 可 以 将 一 个 处 理 一 组 数值 数据 的 程序 写成 一 个 通用 程序 ， 这 意味 着 它 能 够 处 理 任何 数值 类 
型 的 数据 。 无 论 输入 什么 类 型 的 数据 都 可 以 被 它 接受 ， 因 为 当 将 输入 数据 赋 给 变量 时 ， 用 来 存 
储 这 些 数据 的 变量 能 够 与 正确 的 类 型 相 绑 定 。 反 之 ， 如 果 只 是 使 用 静态 类 型 绑 定 的 话 ， 在 不 知 
道 数据 的 类 型 之 前 ， 是 不 可 能 编写 一 个 Java 程 序 来 处 理 这 组 数据 的 。 

在 JavaScript 以 及 PHP 中 ， 变 量 与 类 型 的 绑 定 是 动态 的 。 例 如 ， 一 个 JavaScript 脚 本 可 以 包括 
下 面 的 语句 : | 

list = [10.2, 3.51; 

不 论 这 个 命名 为 1ist 的 变量 先前 是 什么 类 型 ， 这 项 赋值 将 导致 list 成 为 一 个 长 度 为 2 的 一 
维 数值 元 素数 组 。 如 果 赋 值 语句 为 

list = 47; 

在 赋值 之 后 ，1ist 就 成 为 一 个 标量 变量 。 

然而 动态 类 型 绑 定 有 两 个 缺点 。 首 先 ， 它 使 程序 变 得 较 不 可 靠 ， 因 为 相对 于 具有 静态 类 型 
绑 定 语言 的 编译 器 而 言 ， 前 者 的 编译 器 发 现 错误 的 功能 较 弱 。 动 态 类 型 绑 定 允 许 将 任何 变量 赋 
以 任何 类 型 的 值 ， 在 赋值 语句 右边 的 错误 类 型 就 不 能 够 被 发 现 ， 反 之 ， 它 会 将 左边 的 类 型 改 为 
错误 的 类 型 。 例 如 ， 假 设 在 一 个 JavaScript 程 序 中 ，i 和 x 为 当前 存储 的 标量 数量 值 ， 而 y 当 前 存 
储 一 个 数组 。 再 进一步 假设 这 个 程序 需要 赋值 语 名 

但 是 由 于 键入 错误 ， 变 成 了 赋值 语 名 

i = y; 

在 JavaScript 或 任何 一 种 动态 类 型 绑 定语 言 中 ， 解 释 器 都 不 会 发 现 这 条 语句 中 的 错误 ， 仅 
仅 是 将 i 改 为 一 个 数组 而 已 。 但 在 后 来 使 用 i 时 ， 因 为 期 待 i 为 一 个 标量 ， 因 而 不 可 能 得 到 正确 
的 结果 。 在 具有 静态 类 型 绑 定 的 语言 中 ， 例 如 Java， 编 译 器 会 发 现 这 个 错误 ， 因 而 程序 不 会 被 
执行 。 

请 注意 ， 这 种 缺点 也 不 同 程度 地 出 现 于 一 些 使 用 静态 类 型 绑 定 的 语言 中 ， 如 Fortran CL 
及 C++。 在 许多 情况 下 ， 这 些 语 言 自动 将 赋值 语句 中 RHS 的 类 型 转换 成 LHS 的 类 型 ， 

也 许 ， 动 态 类 型 绑 定 最 大 的 缺点 是 它 的 代价 。 实 现 动态 属性 绑 定 的 代价 是 相当 可 观 的 ， 特 
别 是 在 运行 时 。 类 型 检测 必须 在 运行 时 进行 。 此 外 ， 每 一 个 变量 必须 有 一 个 相关 的 运行 时 描述 
符 来 维持 当前 类 型 。 变 量 值 的 存储 空间 必须 是 大 小 可 变 的 ， 因 为 不 同类 型 的 数值 需要 不 同 大 小 
的 存储 空间 。 

最 后 ， 具 有 变量 的 动态 类 型 绑 定 特性 的 语言 ， 通 常用 单纯 的 解释 器 而 不 是 编译 器 来 实现 、 
因为 在 编译 时 ， 计 算 机 指令 的 操作 数 类 型 必须 为 已 知 。 然 而 ， 如 果 A 和 B 的 类 型 在 编译 时 是 未 知 
的 ， 那 么 编译 器 不 能 为 表达 式 A+B 构 建 机 器 指令 。 而 单纯 的 解释 器 的 执行 比 等 价 的 机 器 码 至 少 
要 多 化 费 十 倍 的 时 间 。 当 然 ， 如 果 一 种 语言 是 使 用 单纯 的 解释 器 来 实现 的 ， 它 用 于 动态 类 型 绑 
定 的 时 间 被 隐藏 在 总 的 解释 时 间 中 ， 因 而 在 这 种 环境 下 没有 显 出 那么 高 的 代价 。 另 一 方面 ， 合 
用 静态 类 型 绑 定 的 语言 很 少 通过 单纯 的 解释 器 来 实现 ， 因 为 将 这 种 语言 编写 的 程序 翻译 成 言 效 
率 的 机 器 码 版 本 十 分 容易 。 
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脚本 语言 以 及 其 他 灵活 解决 方案 的 例子 

RASMUS LERDORF 

Rasmus Lerdorf 于 1968 年 出 生 在 格林 兰 海岸 线 的 Disko 岛 。 在 获得 工程 学 位 之 后 ， 
Rasmus Lerdorf 曾 经 就 职 于 几 个 咨询 公司 。 后 来 为 了 追踪 上 网 阅读 他 个 人 简历 的 访问 
#4, Rasmus Lerdorf 开 创 了 第 一 种 PHP 循 环 。 现 在 他 是 开源 运动 的 倡导 者 ， 同 时 就 职 
于 美国 加 州 Sunnyvale 的 Yahoo 公 司 。 





有 关 背 景 

Al: 你 早期 有 哪些 有 关 计 算 机 的 经 验 ? 

Z: 1976 年 ， 我 父亲 和 我 一 起 使 用 从 美国 circa 预 订 来 的 一 套 零 件 装 配 了 一 个 称 为 “Pong” 的 游戏 。 
我 还 记得 大 约 是 在 1978 年 ， 我 得 到 了 德州 仪器 公司 的 一 个 “说 话 与 拼音 ”设备 ， 这 个 设备 装载 了 有 史 以 来 
的 第 一 个 单 心 片 语言 合成 器 。1983 年 左右 ， 我 有 了 自己 的 第 一 台 计 算 机 。 这 是 一 台 Commodore Vic20 型 计 
算 机 ， 具 有 5K 的 内 存 和 1MHZ 的 6502 CPU。 我 当时 耗费 了 大 量 的 时 间 来 键入 从 杂志 上 摘录 的 程序 。 在 高 
中 时 ， 我 曾经 玩 过 Commodore 的 宠物 (PET) 游戏 机 ， 还 有 运行 于 QNX 操 作 系 统 上 的 UNISYS 80186 游 戏 
盒 。QNX 和 是 到 目前 为 止 我 所 见 过 的 最 “ 酷 ” 的 操作 系统 ， 它 对 我 在 后 来 得 到 微软 的 MS-DOS 游 戏 盒 起 到 了 
些微 降温 的 作用 。 我 认为 自己 早期 的 经 验 使 得 我 更 倾向 于 UNIX 以 及 类 似 UNIX 的 操作 系统 。 

Al: 你 最 喜欢 过 去 的 哪 一 份 工作 ? 

E: 我 非常 怀念 我 在 巴西 的 时 光 ， 当 时 的 公司 在 加 州 MV 设 立 了 办 公 室 ， 因 而 是 他 们 最 早 向 我 介绍 了 
硅谷 ， 我 最 终于 1993 年 搬 到 了 那里 。 我 也 很 喜欢 曾经 在 多 伦 多 大 学 的 工作 ， 当 时 帮助 他 们 建立 了 一 个 拨号 
系统 。 有 关 PHP 工 作 的 大 部 分 内 容 就 是 在 这 段 工 作 期 间 创建 的 。 

关于 脚本 语言 的 工作 

IF): 你 关于 脚本 语言 的 定义 是 什么 ? 

B: 一 种 将 传统 程序 设计 技术 解决 特殊 类 型 问题 中 的 繁琐 与 复杂 性 隐蔽 起 来 的 高 级 语言 。 

问 : 当 你 制作 你 的 个 人 网 页 时 ， 想 要 追踪 上 你 个 人 网 站 的 访问 者 ， 后 来 为 多 伦 多 大 学 的 系统 工作 时 ， 
又 想 追 踪 上 网 站 的 大 学 学 生 ， 当 时 你 考虑 使 用 哪些 可 能 的 工具 ? 

E: 我 不 记得 曾经 使 用 过 任何 当时 现 有 的 解决 办 法 。 在 当时 你 通常 仅 能 阅读 服务 器 上 的 原始 访问 
“Log” 文件 。 当 然 ， 当 时 也 有 一 些 多 半 是 用 Perl 语 言 编写 的 “Log” 文 件 的 分 析 工具 用 来 给 出 其 些 方面 的 
总 结 ， 但 当时 我 需要 的 是 ， 当 每 一 次 访问 者 阅读 我 的 简历 时 ， 我 能 够 获得 一 个 电子 邮件 ， 并 且 想 要 知道 这 
个 访问 者 来 自 哪 里 。 当 时 没有 工具 专门 进行 这 些 工作 。 

A]: 是 什么 促成 你 做 出 自己 花 时 间 开 发 解决 办 法 的 决定 ， 而 不 是 使 用 当时 现 有 的 工具 ? 

E: 当时 最 主要 的 替代 工具 是 Perl 语 言 。 尽 管 这 些 年 来 人 们 将 一 些 东 西 归功 于 我 ， 但 我 实际 上 并 不 异 
恨 Perl 语 言 。 我 喜欢 它 ， 并 曾经 大 量 地 使 用 过 它 ， 但 当时 我 的 需求 十 分 简单 。 我 当时 在 一 个 与 人 共享 的 服务 
藻 上 运行 着 我 的 个 人 网 页 ， 我 没有 大 量 的 存储 空间 或 CPU 时 间 ， 为 每 一 次 的 查询 来 回调 用 Perl 的 公共 网 关 接 
` 口 太 耗 费 资 源 。 我 所 需要 的 只 是 一 个 嵌入 到 我 的 Web 服 务 器 的 简单 语法 分 析 器 ， 而 使 用 Perl 程 序 进行 这 种 嵌 
入 太 过 艰难 ， 也 太 过 庞大 ， 况 且 我 当时 从 事 的 工作 并 不 需要 Perl 语 言 的 任何 功能 。 因 而 我 编写 了 一 个 小 型 、 
简单 并 且 当 时 我 认为 是 容易 嵌入 的 语法 分 析 器 。 当 然 它 从 此 往 后 开始 变 大 ， 一 旦 你 开始 给 它 增加 任何 可 能 
的 逻辑 流程 ， 它 就 顺理成章 地 滑 向 了 完整 的 程序 设计 语言 。 但 我 的 初 训 绝对 不 是 编写 一 个 完整 的 语言 。 

In]: PHP 语 言 今天 能 够 提供 哪些 其 他 脚本 语言 (Perl、Tcl、Python、Ruby) 所 不 能 提供 的 功能 ? 

A: PHP 语 言 是 特别 针对 网 络 问题 的 。 你 能 够 读 到 的 关于 PHP 语 言 的 所 有 一 切 都 是 针对 网 络 的 ， 因 此 ， 
如 二 你 试图 解决 网 络 上 的 问题 ， 这 显然 取决 于 你 怎样 应 用 PHP 语 言 。 这 不 像 其 他 较 通用 的 语言 那么 清楚 ， 
你 首先 选择 语言 ， 然 后 再 围绕 特定 的 语言 研究 出 最 好 的 应 用 方式 。 

问 : 关于 PHP 语 言 的 前 景 : 在 代码 方面 的 下 一 个 步骤 是 什么 ?或 者 说 ， 你 想 在 下 一 步 应 该 增加 或 者 应 
该 完善 的 功能 是 什么 ? 
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答 : 我 们 需要 大 量 高 质量 的 PHP 语 言 的 代码 以 及 语言 的 扩展 ， 因 为 在 我 们 以 前 建立 PHP 语 言 的 一 切 时 
并 设 有 周密 与 完善 的 尺度 。 

关于 灵活 解决 办 法 

A); 这 里 是 你 在 以 前 的 访谈 中 所 谈 到 的 ;“ 我 肯定 是 赞成 和 崇尚 对 于 困难 问题 给 予 灵活 解决 办 法 的 。” 
是 什么 样 的 思路 以 及 什么 样 的 行动 ， 导 致 了 这 种 灵活 解决 的 办 法 ? 

答 : 解决 问题 的 办 法 的 关键 是 从 不 同 的 角度 来 逼近 。 有 了 时候， 正规 训练 以 及 传统 观念 可 能 会 阻碍 和 
限制 人 们 的 想象 力 。 你 还 要 有 经 历 多 次 失败 的 准备 。 

一 个 问题 之 所 以 艰巨 ， 是 因为 你 还 没有 找到 解决 问题 的 方法 。 这 有 点 像 你 在 报纸 上 看 到 的 拼 字 游 戏 。 
你 读 着 这 些 朗 乱 堆 砌 在 一 起 的 字母 ， 它 们 不 具有 任何 意义 。 你 试 了 又 试 ， 想 将 这 些 字母 正确 地 组 合 起 来 ， 
但 百 思 不 得 其 解 。 然 后 有 人 悄悄 告诉 了 你 一 个 单词 ， 一 去 那 间 ， 一 切 就 变 得 如 此 地 显而易见 。 现 在 当 你 
来 看 这 些 字母 时 ， 那 个 单词 分 明 就 在 那里 ， 你 不 明白 为 什么 当时 你 就 看 不 见 。 这 就 是 当 我 看 见 别人 对 一 个 
问题 的 灵活 解决 办 法 时 ， 我 所 拥有 的 感觉 。 

H: 你 最 喜欢 的 灵活 解决 办 法 是 什么 ? 

E: 这 个 世界 充满 了 灵活 的 解决 办 法 ， 纸 别针 、 尼 龙 搭 扣 、 圆 珠 笔 。 但 我 猜 你 所 问 的 是 PHP 语 言 中 的 
办 法 。 我 认为 其 中 的 一 个 灵活 解决 办 法 是 将 HTML 中 的 get 、post， 以 及 cookie 数 据 直 接 联系 到 PHP 中 的 
变量 上 。 这 似乎 是 一 件 十 分 显然 的 事情 ， 但 在 当时 却 没有 人 这 么 做 ， 这 使 得 PHP 成 为 解决 网 络 问 题 的 非常 
便捷 的 方式 。 虽 然 这 一 特征 可 能 被 非 正 确 地 使 用 ， 因 而 从 它 开始 起 就 受到 了 一 些 批评 ， 但 我 仍然 坚持 并 且 
赞 贫 这 样 一 种 灵活 的 方式 。 





5.4.2.3 类 型 推理 

ML 是 一 种 既 支 持 函 数 式 程序 设计 又 支持 命令 式 程序 设计 的 程序 设计 语言 (Ullman, 1998), 
ML 采用 了 一 种 有 趣 的 类 型 推理 机 制 ， 运 用 这 种 机 制 能 够 决定 大 部 分 表达 式 的 类 型 ， 而 不 需要 程 
序 人 员 来 指明 其 中 的 变量 类 型 。 

在 通过 ML 函数 研究 类 型 推理 之 前 ， 我 们 来 看 一 下 ML 函数 的 一 般 语法 : 

fun ARM (A) = KRA; 

表达 式 的 值 通过 函数 返回 。” 

现在 我 们 讨论 类 型 推理 。 考 虑 以 下 ML 函数 声明 

fun circumf(r) = 3.14159 * r* r; 

这 指定 了 一 个 自 变 量 取 浮 点 数 〈 在 ML 语言 中 为 real) 并 且 产 生 浮 点 数 结果 的 函数 circumtf。 
函数 的 类 型 从 表达 式 中 常量 的 类 型 推理 出 来 。 同 样 地 ， 下 面 的 函数 

fun timesl0(x) = 10 * x; 

其 中 的 自 变 量 以 及 函数 的 值 被 推理 为 整数 类 型 。 

考虑 下 列 ML 函 数 : 

fun square(x) = x * x; 

ML 从 函数 定义 中 的 “*” 操 作 符 确定 出 参数 以 及 函数 返回 值 的 类 型 。 因 为 “*” 是 一 个 算术 
操作 符 ， 因 而 可 以 设想 参数 以 及 函数 值 为 数值 类 型 。 在 ML 语言 中 的 默认 类 型 为 int， 由 此 可 以 
推理 出 参数 以 及 square 函 数 的 返回 值 类 型 都 为 int。 

如 琳 使 用 一 个 浮 点 数 来 调用 函数 square， 例 如 


square(2.75); 


O ”表达 式 可 以 是 一 个 用 分 号 分 隔 ， 用 圆 括 号 包围 的 表达 式 列表 。 这 个 例子 的 返回 值 是 上 个 表达 式 。 


N 


N 
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就 会 产生 错误 ， 因 为 ML 语言 不 能 够 将 real1 类 型 的 值 转变 为 int 类 型 。 如 采 我 们 想 让 
square 国 数 接受 real 类 型 的 参数 ， HILMGaquer eRe A 

fun square(x) : real = x * X; 

因为 ML 语言 不 允许 重 载 的 函数 ， 因 而 这 个 函数 不 能 够 与 前 面 square 国 数 的 int 版 本 共存 。 

从 函数 值 为 real 类 型 的 事实 足以 推断 出 其 中 参数 也 为 real 类 型 。 下 面 的 这 些 定义 也 都 具 


有 合法 性 : 
fun square(x : real) = x * X; 
fun square(x) = (x : real) * x; 
fun square(x) = x * (x : real); 


纯 函 数 式 语言 Miranda 和 Haskell 中 也 运用 了 类 型 推理 。 


5.4.3 存储 绑 定 与 生存 期 


命令 式 程序 设计 语言 的 一 种 根本 特征 在 很 大 程度 上 取决 于 这 种 语言 中 变量 存储 绑 定 的 设计 
方式 。 因 而 清晰 地 理解 变量 的 存储 绑 定 就 变 得 十 分 重要 。 

变量 所 绑 定 的 存储 单元 必须 取 自 一 个 现 有 存储 单元 的 “ 池 ”。 这 个 过 程 就 称 为 存储 空间 分 配 。 
存储 空间 解除 分 配 则 是 将 已 经 与 变量 解除 绑 定 的 存储 单元 重新 放 回 这 个 池 中 的 过 程 。 

变量 的 生存 期 是 该 变量 被 绑 定 于 某 一 特定 存储 地 址 的 时 间 。 因 此 变量 的 生存 期 开始 于 将 变 
量 绑 定 到 一 个 特定 存储 单元 的 时 刻 ， 而 结束 于 该 变量 从 这 个 存储 单元 上 解除 绑 定之 时 。 为 了 分 
析 变 量 的 存储 绑 定 ， 可 以 较 方 便 地 根据 标量 〈 非 结构 性 的 ) 变量 的 生存 期 将 它们 分 成 四 种 类 型 ， 
分 别 被 称 为 静态 变量 、 栈 动态 变量 、 显 性 淮 动 态 变量 以 及 隐 性 淮 动态 变量 。 下 面 的 几 市 将 讨论 
这 四 种 类 型 的 意义 ， 以 及 它们 的 目的 和 优 缺 点 。 

5.4.3.1 静态 变量 

静态 变量 是 在 程序 运行 开始 之 前 就 被 绑 定 到 存储 单元 之 上 ， 并 直到 程序 运行 结束 之 前 始终 
保持 绑 定 在 相同 的 存储 单元 之 上 的 变量 。 静 态 地 绑 定 于 存储 空间 的 变量 对 于 程序 设计 具有 几 种 
应 用 价值 。 显 然 ， 全 局 可 存 取 的 变量 常 第 用 于 程序 执行 的 整个 过 程 ， 因 此 必须 在 程序 运行 的 整 
个 期 间 将 它们 绑 定 于 相同 的 存储 空间 。 一 些 时 候 ， 让 在 子 程序 中 声明 的 变量 成 为 历史 敏感 的 较 
为 方便 ， 也 就 是 说 ， 让 变量 在 子 程序 的 分 别 调用 执行 期 间 保 持 它 们 的 值 。 这 是 静态 绑 定 于 存储 
空间 的 变量 的 一 个 特征 。 

静态 变量 的 另 一 个 优点 是 高 效率 。 所 有 静态 变量 都 可 以 直接 寻 址 ， 9 其 他 类 型 的 变量 则 常 
党 需要 间接 寻 址 ， 而 间接 寻 址 的 存 取 速 度 比较 慢 。 此 外 ， 静 态 变量 没有 在 运行 时 进行 分 配 与 解 
除 分 配 所 需要 的 额外 代价 。 

静态 绑 定 于 存储 空间 的 一 个 缺点 则 是 灵活 性 较 差 ,尤其 是 一 种 语言 只 具有 静态 存储 绑 定 的 
变量 ， 这 种 语言 不 能 够 支持 递归 子 程序 。 另 一 个 缺点 是 在 这 些 变量 之 间 不 能 够 共享 存储 空间 。 
例如 ， 假 设 一 个 程序 有 两 个 子 程序 ， 而 这 两 个 子 程序 都 需要 大 型 数组 ， 并 且 假 设 从 不 同时 调用 
这 两 个 子 程序 。 如 果 这 些 数组 为 静态 的 ， 这 两 个 子 程序 的 数组 就 不 能 够 共享 存储 空间 。 

C 和 C++ 人 允许 程序 人 员 在 函数 内 变量 的 定义 中 包括 static 修 饰 符 ， 使 得 所 定义 的 变量 成 为 
静态 的 。 请 注意 ， 当 static 修 饰 符 出 现 于 C++、Java 以 及 C# 的 类 定义 中 的 变量 声明 时 ， 与 所 声 
明 变 量 的 生存 期 无 关 。 在 这 种 情况 下 ， 它 仅仅 意味 着 所 声明 变量 是 一 个 类 变量 ， 而 不 是 一 个 实 
例 变量 。 有 时 ， 在 第 一 次 实例 化 类 时 创建 类 变量 。 同 一 个 保留 字 的 多 种 用 途 可 能 令 人 产生 混淆 ， 


O ”在 某 些 实现 中 ， 静 态 变 量 通过 基 址 寄存 器 寻 址 ， 访 问 它们 的 开销 与 访问 栈 分配 的 变量 差不多 。 
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尤其 是 对 语言 的 初学 人 员 而 言 。 

5.4.3.2 栈 动 态 变量 

栈 动态 变量 是 这 样 一 些 变量 : 当 确 立 它 们 的 声明 语句 时 即 产生 了 存储 绑 定 ， 但 它们 的 类 型 
是 静态 绑 定 的 。 这 种 声明 的 确立 指 的 是 由 这 种 声明 所 指示 的 存储 空间 的 分 配 及 绑 定 的 过 程 ， 这 
个 过 程 发 生 在 程序 执行 到 声明 所 依附 的 代码 之 时 。 因 此 这 种 确立 发 生 于 运行 时 。 例 如 ， 在 一 个 
Java 方 法 的 头 部 声明 的 变量 确立 于 调用 这 个 方法 之 时 。 而 在 完成 了 这 个 方法 执行 的 时 候 ， 由 这 
些 声明 定义 的 变量 被 解除 分 配 。 

栈 动态 变量 正如 它们 的 名 字 所 示 ， 其 存储 空间 被 分 配 自 运行 时 的 栈 。 

有 些 语言 《如 C 和 Java) 允许 在 语句 可 以 出 现 的 任何 地 方 进行 变量 声明 。 在 这 些 语言 的 一 些 
实现 中 ， 所 有 在 函数 或 方法 中 声明 的 栈 动态 变量 (不 包括 那些 在 谍 套 块 中 声明 的 变量 ) 可 以 在 
该 函数 或 方法 开始 执行 时 绑 定 到 存储 空间 ， 即 使 其 中 某 些 变 量 不 是 在 一 开始 时 就 声明 。 在 这 种 
情况 下 ， 变 量 在 声明 处 可 见 ， 但 在 函数 或 方法 开始 执行 时 进行 存储 空间 的 绑 定 (如果 声 明 中 指 
定 了 初始 化 ， 则 还 包括 初始 化 ) 。 可 以 在 变量 成 为 可 见 之 前 进行 变量 的 存储 空间 绑 定 ， 这 一 事实 
对 语言 的 语义 没有 影响 。 

至 少 在 大 部 分 情况 下 ,能够 被 实际 运用 的 递归 子 程序 需要 有 某 些 形 式 的 动态 局 部 存储 ， 这样， 
递归 子 程序 的 每 一 个 活动 副本 都 具有 自己 的 局 部 变量 版 本 ， 而 通过 使 用 栈 动 态 变量 ， 这 些 要 求 被 
十 分 方便 地 得 到 了 满足 。 甚 至 在 没有 递归 的 情况 下 ， 子 程序 的 栈 动 态 局 部 存储 也 有 着 优越 性 ， 因 
为 子 程序 中 的 所 有 局 部 变量 都 可 以 共享 相同 的 存储 空间 。 但 与 静态 变量 相 比较 ， 它 所 具有 的 缺点 
征 ， 运 行 时 的 分 配 以 及 解除 分 配 所 需要 的 额外 开销 ， 由 于 间接 寻 址 而 导致 的 较 慢 访问 ， 以 及 子 程 
序 不 能 够 成 为 历史 敏感 的 。 栈 动态 变量 的 分 配 及 解除 分 配 并 不 需要 耗费 大 量 的 时 间 ， 因 为 所 有 在 
子 程序 头 部 声明 的 栈 动态 变量 都 同时 被 施行 分 配 与 解除 分 配 ， 而 不 是 分 别 操作 的 。 

Fortran 95 人 允许 实现 人 员 局 部 地 使 用 栈 动态 变量 ,但 需要 包括 这 样 一 条 语句 : 


Save list 


的 语句 。 如 果 在 一 个 子 程序 中 放置 了 Save 语 句 ， 它 人 允许 程序 人 员 将 该 子 程序 中 的 部 分 或 者 全 部 
的 变量 ( 即 1ist 中 的 那些 变量 ) 指明 为 静态 的 。 

在 Java、C++ 以 及 C# 中 ， 在 方法 中 定义 的 变量 默认 为 是 栈 动态 的 a 而 在 Ada 中 ， 所 有 定义 
于 子 程序 中 的 非 堆 变量 都 是 栈 动态 的 。 

”除了 存储 之 外 的 所 有 属性 都 是 被 静态 地 绑 定 于 栈 动态 标量 变量 上 。 对 于 一 些 结构 化 类 型 则 
不 是 如 此 ， 我 们 将 在 第 6 章 讨论 这 一 点 。 对 于 栈 动态 变量 的 分 配 以 及 解除 分 配 过 程 的 实现 ， 将 在 
第 10 章 中 进行 讨论 。 

5.4.3.3 显 式 堆 动态 变量 

显 式 堆 动态 变量 是 由 程序 人 员 指 定 的 显 式 运行 时 指令 来 进行 分 配 与 解除 分 配 的 无 名 (抽象 ) 
存储 单元 。 这 些 从 堆 上 被 分 配 和 解除 分 配 的 变量 只 能 通过 指针 变量 或 者 引用 变量 来 引用 。 堆 是 
一 组 由 于 使 用 的 不 规则 性 而 在 组 织 上 高 度 松散 的 存储 单元 。 一 个 显 式 堆 动态 变量 具有 两 个 与 其 
关联 的 变量 : 其 中 的 一 个 变量 是 指针 或 引用 变量 ， 只 有 通过 这 个 变量 才 可 以 访问 堆 动 态 变量 ， 
另 一 个 变量 则 是 堆 动 态 变量 自身 。 建 立 这 个 指针 或 引用 变量 的 方式 与 建立 其 他 任何 标量 变量 的 
方式 一 样 。 通 过 一 个 操作 符 (例如 在 Ada 和 C++ 中 ) 或 一 个 专 为 此 目的 而 提供 的 系统 子 程序 的 调 
用 〈 例 如 在 C 中 ) 来 产生 一 个 显 式 堆 动态 变量 。 

在 C++ 中 ， 名 为 new 的 分 配 操作 符 使 用 一 个 类 型 名 作为 它 的 操作 数 。 当 执行 这 个 分 配 操 作 
符 时 ， 即 产生 一 个 操作 数 类 型 的 显 式 堆 动 态 变 量 ， 并 且 返 回 一 个 指向 该 堆 动态 变量 的 指针 。 由 
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于 显 式 堆 动态 变量 是 在 编译 时 与 类 型 相 绑 定 ， 因 而 这 种 绑 定 是 静态 的 。 然而 在 产生 这 种 变量 时 ， 
它 就 与 存储 空间 相 绑 定 ， 这 种 绑 定 发 生 于 运行 时 。 
除了 用 于 产生 显 式 堆 动态 变量 的 子 程序 或 操作 符 以 外 ， 一 些 语言 还 包括 用 于 显 式 删除 它们 


的 子 程序 或 操作 符 。 
作为 显 式 堆 动 态 变量 的 一 个 例子 ， 考 虑 下 面 的 一 段 C++ 程序 ， 
int *intnode; // 建立 一 个 指针 


intnode = new int; // 建立 堆 动态 变量 
delete intnode; // 将 intnodqe 指 向 的 堆 动态 变量 解除 分 配 


在 这 个 例子 中 ， 通过 new 操 作 符 创 建 一 个 int 类 型 的 显 式 堆 动态 变量 ， 然后 可 以 通过 指针 
intnode 来 引用 这 个 变量 。 接 下 来 ， 通过 delete 操 作 符 将 该 变量 解除 分 配 。C++ 语 言 要 求 有 
显 式 解除 分 配 操 作 符 delete， 原因 是 这 种 语言 不 使 用 隐 式 存储 空间 的 回收 ， 例 如 垃圾 收集 ， 

在 Java 语 言 中 ， 除 了 基本 标量 之 外 的 所 有 数据 都 是 对 象 ，Java 中 的 对 象 是 显 式 堆 动态 变量 ， 
并 且 是 通过 引用 变量 来 访问 。Java 语言 不 具有 任何 显 式 的 方式 来 删除 显 式 堆 动态 变量 ， 反 之 ， 
它 使 用 的 是 隐 式 垃圾 收集 。 

C# 语 言 既 有 堆 动 态 对 象 也 有 栈 动 态 对 象 ， 这 两 者 都 是 隐 式 地 解除 分 配 。 除 此 以 外 ，C# 还 支 
持 C++ 风 格 的 指针 。 这 种 指针 被 用 来 引用 堆 、 栈 甚 至 是 静态 的 变量 以 及 对 象 。 这 些 指针 与 C++ 
中 的 指针 一 样 具 有 危险 性 ， 而 且 由 这 些 指针 引用 的 堆 对 象 不 是 隐 式 地 解除 分 配 。 C# 语 言 之 所 以 
包括 这 些 指针 ， 和 在 布 望 C# 语 言 的 程序 组 件 能 够 与 C 以 及 C++ 语言 的 程序 组 件 一 起 工作 ， 为 了 表 
未 不 或 励 使 用 指针 ， 任 何 定义 了 指针 的 方法 都 必须 包括 保留 字 unsafe (不 安全 )。 

显 却 堆 动态 变量 常用 于 动态 结构 ， 如 链表 以 及 树 结构 ， 这 些 结构 需要 在 运行 期 间 生 长 或 收 
绑 。 通 过 使 用 指针 或 者 引用 ， 以 及 使 用 显 式 堆 动态 变量 ， 能 够 很 方便 地 构造 出 这 类 结构 。 

显 式 堆 动 态 变量 的 缺点 是 难于 正确 地 使 用 指针 变量 与 引用 变量 ， 连同 这 种 变量 的 引用 、 变 
量 的 分 配 以 及 变量 的 解除 分 配 所 具有 的 代价 ， 还 有 存储 管理 在 实现 上 的 复杂 性 。 实 质 上， 这 就 
征 耗 时 而 复杂 的 堆 管理 问题 。 关 于 显 式 堆 动态 变量 的 实现 方法 ， 将 在 第 6 章 进 行 深入 讨论 。 

5.4.3.4 隐 式 堆 动态 变量 

隐 式 堆 动态 变量 只 有 当 它 们 被 赋值 时 才 被 绑 定 到 堆 存储 空 间 。 实 际 上 ， 当 它 们 每 次 被 赋值 时 ， 
其 所 有 的 属性 都 被 绑 定 。 在 某 种 意义 上 ， 它们 仅仅 是 适应 于 任何 被 请 求 的 用 途 的 名 字 。 例 如 ， 考 
虑 下面 的 JavaScript 赋 值 语句 ; 


highs=[74, 84, 86, 90, 71]; 


不 党 变量 highs 是 否 是 预先 用 在 程序 中 ， 还 是 有 其 他 用 途 ， 现在 它 都 是 具有 5 个 数字 值 的 数组 。 

这 种 变量 的 优点 是 它们 具有 高 度 的 灵活 性 ， 允 许 编写 极为 通用 的 程序 ， 而 缺点 则 是 在 运行 时 
维护 所 有 动态 属性 的 额外 开销 ， 需要 在 各 项 属性 中 包括 数组 下 标的 类 型 和 范围 。 另 一 个 缺点 是 如 
我 们 在 5.4.2.2 节 中 讨论 的 ， 编 译 器 会 遗漏 某 些 错误 的 检查 。 此 外 ， 隐 式 堆 动 态 变量 也 存在 与 显示 
礁 动态 变量 一 样 的 存储 管理 问题 。JavaScript 中 隐 却 堆 动态 变量 的 例子 曾 在 5.4.2.2 节 中 给 出 。 


5.5 类 型 检测 


为 了 便于 讨论 类 型 检测 ， 我 们 将 操作 数 和 操作 符 的 概念 一 般 化 ， 使 得 它们 也 包括 子 程 序 以 
及 赋值 语句 。 我 们 将 认为 子 程序 也 是 操作 符 ， 而 子 程序 中 的 参数 即 为 操作 数 。 我 们 将 认为 赋值 
运算 符 是 二 元 操作 符 ， 而 它 的 目标 变量 以 及 它 的 表达 式 即 为 操作 数 。 
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类 型 检测 是 保证 一 个 操作 符 的 所 有 操作 数 都 具有 相互 兼容 类 型 的 措施 。 兼 容 类 型 是 对 操作 
符 而 言 为 合法 的 类 型 ， 或 者 在 语言 规定 的 允许 下 ， 能 够 被 编译 器 (或 解释 器 ) 产生 的 代码 隐 式 
地 转换 成 为 合法 类 型 。 这 种 自动 类 型 的 转换 被 称 为 强制 转换 。 例 如 在 Java 语 言 中 ， 如 果 将 一 个 
int 类 型 的 变量 与 一 个 ELoat 类 型 的 变量 相 加 ， 该 int 变 量 的 值 就 被 强制 转换 成 为 ELoat 数 值 
并 加 上 一 个 小 数 点 。 

类 型 错误 是 将 操作 符 作 用 于 具有 不 适当 类 型 的 操作 数 。 例 如 在 C 的 初期 版 本 中 ， 如 果 将 一 
个 int 数 值 传递 给 一 个 期 望 fE10at 数 值 的 函数 ， 就 会 产生 一 个 类 型 错误 (因为 这 种 语言 的 编译 
器 不 检测 参数 的 类 型 )。 

如 果 在 一 种 语言 中 ， 所 有 变量 类 型 的 绑 定 都 是 静态 的 ， 那 么 几乎 总 是 能 够 静态 地 进行 类 型 
检测 。 动 态 类 型 的 绑 定 要 求 在 运行 时 进行 类 型 检测 ， 这 种 类 型 的 检测 被 称 为 动态 类 型 检测 。 

一 些 语言 ， 如 JavaScript 和 PHP， 因 为 它们 具有 动态 类 型 绑 定 ， 所 以 只 人 允许 动态 类 型 检测 。 
在 编译 时 发 现 错误 比 在 运行 时 发 现 错误 优越 得 多 ， 因 为 一 般 而 言 ， 改 正 错 误 越 早 代 价 就 越 低 。 
静态 检测 的 缺点 是 缺少 灵活 性 ， 可 以 利用 的 捷径 与 技巧 很 少 。 现 在 ， 这 种 技术 一 般 不 被 看 好 。 

当 一 种 语言 允许 存储 单元 在 执行 期 间 的 不 同时 间 存 储 不 同 的 类 型 值 时 ， 类 型 检测 就 变 得 十 
分 复杂 。 这 种 情形 出 现 于 使 用 Ada 语 言 的 变 体 记录 、EFortran 中 的 Equivalence， 以 及 C 和 C++ 中 的 
union。 如 各 在 这 些 情形 中 要 完成 类 型 检测 ， 就 必须 施行 动态 类 型 检测 ， 并 且 要 求 运行 时 系统 
保持 存储 单元 里 当前 值 的 类 型 。 所 以 ， 即 使 语言 中 的 所 有 变量 都 与 类 型 静态 地 绑 定 ， 如 在 C++ 
语言 中 那样 ， 但 也 并 不 是 通过 静态 类 型 检测 就 能 够 发 现 所 有 的 类 型 错误 。 


5.6 强 类 型 化 


强 类 型 化 是 语言 设计 中 的 新 思想 之 一 ， 这 种 新 思想 在 20 世 纪 70 年 代 里 所 谓 结构 化 程序 设计 
单 命 中 成 为 主流 。 强 类 型 化 被 广泛 认为 是 一 种 具有 很 高 价值 的 概念 ， 但 是 它 常 常 没有 严谨 的 定 
义 ， 有 时 其 至 在 完全 没有 定义 的 情况 下 用 于 计算 机 的 文献 之 中 。 

只 要 茶 个 程序 设计 语言 总 能 够 发 现 其 程序 中 的 类 型 错误 ， 我 们 就 定义 这 种 程序 设计 语言 》 
强 类 型 的 。 这 就 要 求 能 够 在 编译 时 或 运行 时 确定 所 有 操作 数 的 类 型 。 强 类 型 化 的 重要 性 在 于 它 
能 够 发 现 所 有 因为 变量 的 误 用 而 导致 的 类 型 错误 。 一 种 强 类 型 的 语言 也 允许 在 运行 时 检测 能 够 
存储 多 个 类 型 值 的 变量 中 不 正确 类 型 值 的 使 用 。 

Fortran 95 不 是 强 类 型 的 ， 因 为 在 不 同类 型 的 变量 之 间 使 用 Equivalence， 就 允许 了 一 种 
类 型 的 变量 可 以 引用 不 同类 型 的 值 。 当 一 个 Equivalence 的 变量 被 引用 或 者 被 赋值 时 ， 没 有 
系统 能 够 检测 其 值 的 类 型 。 事 实 上 ， 如 果 对 于 Equivalence 变 量 进行 类 型 检测 ， 将 会 失去 
Equivalence 变 量 的 大 部 分 用 途 。 

Ada 几 平 症 强 类 型 的 。 它 仅仅 几乎 是 强 类 型 的 ， 因 为 Ada 人 允许 程 序 人 员 通 过 特别 要 求 来 中 止 
对 于 菜 种 特殊 类 型 转换 进行 类 型 检测 ， 这 违反 了 Ada 中 类 型 检测 的 规则 。 只 有 当 调 用 通用 函数 
指令 Unchecked_Conversion 时 ,才能 够 暂时 地 中 止 类 型 检测 。 可 以 使 用 这 个 函数 对 任何 一 
对 子 类 型 施行 实例 化 。° 其 中 之 一 ， 它 取 其 参数 类 型 的 一 个 值 ， 并 返回 这 个 参数 当前 值 的 位 串 。 
在 这 里 ， 实 际 转换 并 没有 发 生 ， 它 只 是 抽取 一 种 类 型 的 变量 值 ， 并 将 这 个 变量 值 作为 不 同 的 类 
型 来 使 用 。 这 种 方法 对 于 用 户 定义 的 存储 空间 的 分 配 和 解除 分 配 操 作 十 分 有 用 。 在 这 些 操作 中 ， 
将 地 址 作为 整数 来 处 理 ， 但 又 必须 将 地 址 作为 指针 来 使 用 。 因 为 在 Unchecked Conversion 


O 通常 ， 这 两 个 子 类 型 必须 具有 相同 的 长 度 。 然 而 在 一 种 实现 中 ， 可 以 为 不 同 长 度 的 子 类 型 提供 通用 的 
Unchecked_Conversion 指 令 ， 并且 为 如 何 进 行 不 同 的 实现 而 修改 规则 。 
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中 不 进行 检测 ， 程 序 人 员 有 责任 确保 这 种 转换 所 获得 的 值 是 有 意义 的 。 

C 和 C++ 都 不 是 强 类 型 的 语言 ， 因 为 这 两 种 语言 都 包括 了 union 类 型 ， 但 是 都 不 对 这 种 类 型 
实施 类 型 检测 。 

ML 是 强 类 型 的 ， 尽 管 一 些 函 数 参 数 的 类 型 在 编译 时 可 能 是 未 知 的 。 

虽然 Java 以 及 C# 是 基于 C++ 的 语言 ， 但 它们 与 Ada 语 言 为 同样 意义 上 的 强 类 型 。 语 言 中 的 类 
型 能 够 被 显 式 地 转换 ， 这 可 能 会 导致 类 型 错误 。 但 是 ， 它 们 却 能 够 发 现任 何 隐 式 类 型 错误 。 

一 种 语言 的 强制 转换 规则 在 数值 类 型 检测 上 有 具有 重要 影响 。 例 如 在 Java 中 ， 表 达 式 是 强 类 
型 的 。 然 而 ， 一 个 算术 操作 符 具 有 一 个 浮 点 操作 数 和 一 个 整数 操作 数 是 合法 的 。 这 个 整数 操作 
数 的 值 被 强制 转换 成 为 浮 挟 数 ， 从 而 产生 一 个 浮 点 运算 。 这 正 是 程序 人 员 通 常 想 要 的 。 然 而 ， 
强制 转换 也 会 导致 语言 失去 检测 错误 的 能 力 ， 而 检测 错误 正 是 我 们 需要 强 类 型 的 原因 之 一 。 例 
如 ， 假 设 一 个 程序 具有 int 类 型 的 两 个 变量 a 与 5p， 以 及 一 个 float 类 型 的 变量 d。 现在 ， 如 果 
一 个 程序 人 员 试 图 键入 a + b， 但 却 错误 地 键入 了 a + d， 编 译 器 就 不 能 够 检测 出 这 个 错误 。a 的 
值 就 会 被 强制 转换 成 为 Eloat 类 型 。 因 此 强 类 型 化 的 价值 会 因为 强制 转换 而 有 所 减弱 。 一 些 语 
言 ， 如 Fortran、C 以 及 C++， 具 有 大 量 的 强制 转换 ， 因 而 这 些 语言 较 之 仅 具 有 较 少 量 强 制 转换 的 
语言 ， 如 Ada， 可 靠 程度 要 差 得 多 。Javal 以 及 C# 只 具有 C++ 的 赋值 类 型 强制 转换 数量 的 一 半 ， 所 
以 Java 与 C# 发 现 错误 的 能 力 比 C++ 要 强 ， 但 是 仍然 不 能 够 具有 Ada 语 言 那 么 高 的 效率 。 关 于 强制 
转换 的 问题 ， 还 将 在 第 7 章 中 详细 地 研究 。 


5.7 类 型 等 价 


类 型 兼容 的 思想 成 型 于 类 型 检测 被 引入 时 。 兼 容 规则 指定 每 个 操作 符 可 接受 的 操作 数 的 类 
型 ， 并 且 随 之 指定 了 该 语言 可 能 的 错误 类 型 。 把 这 种 规则 称 为 兼容 的 原因 是 ， 为 了 使 操作 符 
接受 操作 数 ， 在 某 些 情况 下 ， 操 作 数 的 类 型 能 被 编译 器 或 运行 时 系统 隐 式 转换 。 
类 型 兼容 规则 对 于 预定 义 标量 类 型 是 简单 的 和 固定 的 。 
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1971) 没有 清楚 说 明 什么 时 候 应 该 。。 情况 下， 这些 规则 更 复杂 。 这 些 类 型 的 强制 性 是 很 少 的 ， 
运用 名 字 类 型 等 价 或 结构 类 型 等 。 ”因此 这 里 的 问题 不 是 类 型 兼容 ， 而 是 类 型 等 价 。 也 就 是 说 ， 
价 .这 对 语言 的 可 移植 性 极为 不 利 。 ”假如 在 一 个 表达 式 中 ， 一 种 类 型 的 操作 数 被 另 一 种 类 型 的 
因为 在 一 种 实现 中 是 正确 的 程序 ， ”操作 数 替代 而 无 强制 性 ， 那 么 这 两 种 类 型 是 等 价 的 。 类 型 
在 另外 一 种 实现 中 可 能 不 合法 。 ”等 价 是 类 型 兼容 的 一 种 严格 形式 一 一 没有 强制 性 的 兼容 。 
ISO 标准 化 的 Pascal (ISO, 1982) ”这 里 的 主要 问题 是 如 何 定义 类 型 等 价 。 
清楚 地 说 明了 语言 的 类 型 等 价 规 语言 中 的 类 型 兼容 规则 设计 是 十 分 重要 的 ， 因 为 它 影响 
则 。 这 个 规则 既 非 完全 取决 于 名 着 数据 类 型 的 设计 ， 以 及 类 型 值 操作 的 设计 。 这 里 讨论 的 类 
字 ， 也 非 守 全 取决 于 结构 。 在 大 型， 很 少 有 预定 义 操作 。 也 许 两 个 变量 具有 兼容 类 型 的 最 重 
人 要 结果 ， 是 它们 之 中 的 任意 一 个 可 以 将 值 赋 给 另 一 个 。 
is AO te 有 两 种 不 同 的 类 型 等 价 方法 ， 名 字 等 价 以 及 结构 等 价 。 

ERNE 名 字 类 型 等 价 意味 着 : 两 个 变量 具有 等 价 类 型 ， 仅 当 它 们 

或 者 被 定义 于 同一 个 声明 之 中 ， 或 者 被 定义 于 使 用 相同 类 型 名 的 声明 之 中 。 结 构 类 型 等 价 意味 
者 : 两 个 变量 具有 等 价 的 类 型 ， 如 果 它 们 的 类 型 具有 完全 相同 的 结构 。 这 两 种 方法 还 有 一 些 变 
体 ， 大 部 分 语言 使 用 的 是 这 两 种 方法 的 结合 形式 。 


O ”在 子 程序 调用 中 的 实 参 和 子 程序 定义 的 形 参 之 间 ， 也 存在 有 类 型 兼容 问题 。 第 9 章 将 讨论 这 个 问题 。 


AF. PE, RBA Fo tk AH 149 
ed a a oe 


名 字 类 型 等 价 容 易 实 现 ， 但 有 着 高 度 的 局 限 性 。 从 严格 意义 上 ， 一 个 整数 子 范围 类 型 的 变 
量 不 会 与 一 个 整数 类 型 的 变量 等 价 。 例 如 ， 假 设 Ada 使 用 了 严格 的 名 字 类 型 等 价 ， 考 虑 下 面 的 
声明 : | 

type Indextype is 1..100; 


count : Integer; 
index : Indextype; 


变量 count 与 变量 index 不 等 价 ， 因 而 不 能 够 将 count 的 值 赋 给 index， 反 向 赋值 也 不 
可 能 。 

当 一 个 结构 类 型 通过 参数 在 一 些 子 程序 中 传递 时 ， 就 产生 了 另 一 种 名 字 等 价 问题 。 这 样 的 
类 型 只 能 够 被 全 局 定义 一 次 。 子 程序 不 能 够 局 部 地 声明 形 参 的 类 型 。 这 正 是 Pascal 最 初版 本 中 
的 情形 。 

和 注意， 为 了 使 用 名 字 类 型 等 价 ， 所 有 类 型 必须 有 名 字 。 大 多 数 语言 允许 用 户 定义 原本 匿名 
的 类 型 。 为 了 让 一 种 语言 使 用 名 字 类 型 等 价 ， 编 译 器 必须 隐 式 指定 这 些 类 型 的 内 部 名 字 

结构 类 型 等 价 比 名 字 类 型 等 价 更 为 灵活 ， 但 也 更 难以 实现 。 在 名 字 类 型 等 价 中 ， 只 需要 比 
较 两 个 类 型 名 字 以 确定 是 否 等 价 ， 然 而 在 结构 类 型 等 价 中 ， 两 种 类 型 的 整个 结构 都 必须 进行 比 
较 ， 而 这 种 比较 并 非 总 是 简单 的 (考虑 一 种 数据 结构 引用 自己 的 类 型 的 情形 ， 例 如 一 个 链表 )、 
还 会 产生 其 他 问题 。 例 如 ， 如 果 两 个 记录 (或 者 两 个 struct) 类 型 具有 相同 的 结构 ， 但 域名 不 
同 ， 它 们 古 否 等 价 ?” 如 果 两 个 Ada 程 序 中 的 一 维 数组 类 型 具有 相同 的 元 素 类 型 ， 但 下 标 范围 分 别 
为 0，…，10 和 1，…，11， 它 们 是 否 等 价 ” 如 果 两 个 枚 举 类 型 具有 同样 数目 的 组 成 部 分 ， 但 字 
面 常 量 的 拼 法 不 同 ， 它 们 又 是 否 等 价 ? 

结构 类 型 等 价 的 另 一 个 难题 是 无 法 区 分 具有 相同 结构 的 类 型 。 例 如 ， 考 虑 下 面 的 类 Pascal 
声明 : 


type celsius = float; 
fahrenheit = float; 


这 两 种 类 型 的 变量 类 型 在 结构 类 型 等 价 下 被 认为 是 等 价 的 ， 它 们 被 允许 在 表达 式 中 相 混合 
然而 这 肯定 不 是 我 们 期 望 的 。 一 般 而 言 ， 具 有 不 同名 字 的 类 型 可 能 是 不 同 种 类 问题 值 的 抽象 
而 不 应 该 将 它们 视 为 等 同 。 | 

Ada 使 用 名 字 类 型 等 价 ， 但 是 提供 了 两 种 类 型 结构 ， 即 子 类 型 与 派生 类 型 ， 这 两 种 类 型 避 
免 了 上 面 所 述 的 问题 。 派 生 类 型 是 一 种 新 类 型 ， 它 基于 某 种 以 前 定义 的 类 型 ， 但 又 与 那个 作为 
基础 的 类 型 并 不 等 价 ， 虽 然 它 也 可 能 与 之 具有 同一 种 结构 。 派 生 类 型 继承 它们 父 类 型 中 的 所 有 
性 质 。 考 虑 下 面 的 例子 ， 


type celsius is new Float; 
type fahrenheit is new Float; 


这 两 种 派生 类 型 的 变量 类 型 是 不 等 价 的 ， 尽 管 它们 的 结构 相同 。 此 外 ， 这 两 种 派生 类 型 的 
变量 都 不 与 任何 其 他 浮 点 类 型 等 价 。 但 这 个 规则 不 适宜 于 字面 常量 。 一 个 字面 常量 (例如 3.0) 
县 有 通用 实数 类 型 ， 并 与 任何 浮 点 类 型 等 价 。 派 生 类 型 在 继承 了 父 类 型 的 所 有 操作 之 时 ， 也 继 
水 了 其 父 类 型 上 的 范围 限制 。 

Ada 中 的 子 类 型 是 一 种 已 有 类 型 的 范围 受 限 版 本 。 子 类 型 与 其 父 类 型 相等 价 。 例 如 ， 考 虐 
下 面 的 声明 ， 

subtype Small type is Integer range 0..99; 

Smal1_type 类 型 与 Integer 类 型 是 等 价 的 。 
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对 于 Ada 语 言 中 非 限制 性 数组 类 型 的 变量 ， 我 们 使 用 结构 等 价 。 例 如 ， 考 虑 下 面 的 类 型 声 
明 以 及 有 关 两 个 对 象 的 声明 : 


type Vector is array (Integer range <>) of Integer; 
Vector_1: Vector (1..10); 
Vector_2: Vector (11..20); 


这 两 个 对 象 的 类 型 是 等 价 的 ， 虽 然 它们 分 别 具 有 不 同 的 名 字 和 不 同 的 下 标 范 围 。 因 为 对 于 
非 限 制 性 数组 类 型 的 对 象 ， 我 们 使 用 结构 类 型 等 价 而 不 是 名 字 类 型 等 价 。 又 因为 这 两 种 类 型 都 
具有 十 个 元 素 ， 并 且 这 些 元 素 的 类 型 都 为 整数 ， 因 而 这 两 个 对 象 是 等 价 的 。 

对 于 限制 匿名 类 型 来 说 ，Ada 使 用 了 一 种 名 字 类 型 等 价 的 、 高 度 受 限 的 形式 。 考 虑 下 面 Ada 
语言 中 有 关 限 制 匿名 类 型 的 一 些 声 明 : 

A : array (1..10) of Integer; 

在 这 种 情形 中 ，&A 具 有 匿名 但 唯一 的 、 由 编译 器 指定 而 程序 不 可 知 的 类 型 。 如 采 我 们 也 有 

B : array (1..10) of Integer; | 

A 和 了 B 都 会 有 匿名 但 不 相同 也 不 等 价 的 类 型 ， 尽 管 它们 结构 上 相同 。 下 面 的 多 重 声明 

C，D : array (1..10) of Integer; 
产生 两 个 匿名 的 类 型 ， 一 个 是 的 类 型 ， 另 一 个 是 D 的 类 型 ， 它 们 是 不 等 价 的 。 实 际 上 可 以 将 这 
个 声明 处 理 成 下 面 的 两 个 声明 : | 


C : array (1..10) of Integer; 
D : array (1..10) of Integer; 


注意 ， 名 字 类 型 等 价 的 Ada 形 式 比 本 市 开始 定义 的 名 字 类 型 等 价 更 严格 。 假 如 我 们 将 它们 
改写 为 : 

type List 10 is array (1..10) of Integer; 

C, D : List_10; 
那么 现在 ，C 和 D 的 类 型 是 等 价 的 。 

除了 匿名 的 数组 之 外 ，Ada 中 的 所 有 类 型 必须 都 要 指定 ， 这 也 是 其 名 字 类 型 等 价 性 性 能 良 


好 的 原因 之 一 。 


就 语言 而 言 ，Ada 中 的 类 型 等 价 规则 比 具有 许多 类 型 之 间 的 强制 转换 的 语言 规则 更 为 重要 。 
例如 在 Java 中 ， 加 法 操作 符 的 两 个 操作 数 实质 上 可 以 为 语言 中 数值 类 型 的 任意 组 合 。 可 以 将 其 
中 的 一 个 操作 数 强 制 转换 成 另 一 个 操作 数 的 类 型 ， 但 是 在 Ada 语 言 中 ， 则 不 具有 算术 操作 符 的 
操作 数 的 强制 转换 。 

C 使 用 了 名 字 类 型 等 价 和 结构 类 型 等 价 。 每 一 个 struct 及 union 的 声明 都 产生 一 个 与 所 有 
其 他 类 型 不 等 价 的 新 类 型 。 因 此 ， 名 字 类 型 等 价 用 在 结构 、 枚 举 和 联合 类 型 中 。 甚 他 非 标量 类 
型 使 用 结构 类 型 等 价 。 假 如 数组 类 型 有 相同 类 型 的 成 分 ， 则 它们 是 等 价 的 。 当 然 ， 如 果 数 组 类 
型 是 恒定 大 小 ， 那 么 它 对 同样 恒定 大 小 的 其 他 数组 或 没有 恒定 小 的 其 他 数组 都 是 等 价 的 。 请 广 
意 ， 在 C 和 C++ 语言 中 的 typedef 并 不 引入 新 的 类 型 ， 它 只 是 为 已 有 的 类 型 定义 一 个 新 的 名 
称 。 因 而 ， 任 何 使 用 typedef 定 义 的 类 型 都 等 价 于 其 父 类 型 。C 为 结构 、 枚 举 和 联合 使 用 名 字 
类 型 等 价 的 一 个 例外 是 ， 如 果 在 不 同 的 事件 中 定义 两 个 结构 、 枚 举 或 联合 ， 那 么 此 时 使 用 结构 
类 型 等 价 。 在 允许 不 同文 件 中 定义 的 结构 、 枚 举 和 联合 等 价 的 名 字 类 型 等 价 规则 中 ， 这 是 一 个 
漏洞 。 

C++ 语言 同 C 语 言 一 样 ， 和 希望 使 用 名 字 等 价 性 。 
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在 不 允许 用 户 定义 类 型 ， 也 不 允许 用 户 命名 类 型 的 语言 ， 如 Fortran 及 COBOL 语 言 中 ， 显 然 
不 能 够 使 用 名 字 等 价 性 。 

面向 对 象 的 语言 (如 Java 和 C++) 带 来 了 另 一 种 类 型 兼容 问题 ， 这 个 问题 就 是 对 象 的 兼容 
以 及 它 与 继承 层次 的 关系 。 这 个 问题 将 在 第 12 章 中 讨论 。 

表达 式 中 的 类 型 兼容 将 在 第 7 章 中 讨论 ， 子 程序 参数 的 类 型 兼容 则 将 在 第 9 章 中 讨论 。 


5.8 作用 域 


作用 域 是 理解 变量 的 最 重要 因素 之 一 。 程 序 变量 的 作用 域 是 语句 的 一 个 范围 ， 在 这 个 范围 之 
内 变量 为 可 见 的 。 如 果 一 个 变量 在 一 条 语句 中 可 以 被 引用 ， 这 个 变量 即 在 这 条 语句 中 为 可 见 的 。 

一 种 语言 的 作用 域 规则 决定 着 如 何 将 一 个 名 字 的 特定 出 现 与 一 个 变量 相关 联 。 尤 其 是 ， 作 
用 域 规则 决定 在 当前 执行 的 子 程序 或 程序 块 之 外 所 声明 的 变量 引用 怎样 与 这 种 变量 声明 以 及 变 
量 属 性 相关 联 (关于 程序 块 将 在 第 5.8.2 市 里 讨论 )。 全 面 地 和 掌握 语言 中 的 这 些 规 则 ， 对 我 们 运用 
这 种 语言 编写 或 阅读 程序 的 能 力 十 分 关键 。 

如 在 第 5.4.3.2 节 所 定义 的 ， 如 果 一 个 变量 声明 于 一 个 子 程序 单元 或 程序 块 之 内 ， 那 么 它 就 
是 这 个 子 程序 单元 或 程序 块 内 的 局 部 变量 。 程 序 单元 或 程序 块 的 非 局 部 变量 是 指 不 在 这 个 程序 
单元 或 程序 块 中 声明 、 但 又 对 其 可 见 的 变量 。 

关于 类 、 包 以 及 名 字 空 间 的 作用 域 问题 将 在 第 11 章 中 讨论 。 


5.8.1 静态 作用 域 


ALGOL 60 引 入 了 将 名 字 绑 定 于 非 局 部 变量 的 方法 ， 这 种 方法 就 称 为 静态 作用 域 ， 它 被 后 
来 的 大 多 数 命令 式 语言 采用 ， 同 时 也 被 许多 非 命令 式 语言 采用 。 之 所 以 称 为 静态 作用 域 ， 是 因 
为 可 以 静态 地 决定 变量 的 作用 域 ， 即 在 执行 之 前 决定 变量 的 作用 域 。 这 就 允许 人 工程 序 阅读 器 
决定 程序 中 每 个 变量 的 类 型 。 

有 两 类 静态 作用 域 语言 一 类 是 ， 语 言 中 的 子 程序 可 以 被 出 套 ， 并 产生 幅 套 的 静态 作用 
域 ， 另 一 类 是 ， 语 言 中 的 子 程序 不 可 以 被 撕 套 。 在 后 一 类 语言 中 ， 还 是 由 子 程序 来 产生 静态 作 
用 域 ， 但 是 嵌 套 的 作用 域 只 能 够 由 嵌 套 的 类 定义 以 及 嵌 套 的 块 产生 (参见 第 5.8.2 节 )。 

Ada、JavaScript 和 PHP 克 许 伐 套 的 子 程序 ， 然 而 基于 C 的 语言 却 不 允许 。 

在 这 一 章 中 ， 我 们 对 于 静态 作用 域 的 讨论 将 集中 在 那些 允许 嵌 套 的 子 程序 的 语言 。 因 而 从 
现在 开始 我 们 假设 所 有 作用 域 都 与 程序 单元 相关 联 。 在 这 一 章 中 我 们 还 假设 在 所 讨论 的 语言 
作用 域 是 访问 非 局 部 变量 的 唯一 方法 。 这 个 假设 并 非 对 所 有 语言 成 立 ， 甚 至 对 于 所 有 使 用 静态 
作用 域 的 语言 ， 这 个 假设 都 不 成 立 。 这 种 假设 仅仅 是 为 了 简化 这 里 的 讨论 。 

假设 一 个 程序 是 用 一 种 静态 作用 域 的 语言 来 编写 的 ， 当 程序 的 读者 发 现 对 一 个 变量 的 引用 
时 ， 为 了 确定 该 变量 的 属性 ， 就 必须 找到 该 变量 的 声明 语句 。 在 具有 幅 套 子 程序 的 静态 作用 域 
的 语言 中 ， 这 个 过 程 可 以 这 样 进行 ， 假设 对 于 变量 x 的 引用 发 生 于 子 程序 Sub1 中 。 首 先 通过 搜 
索 子 程序 Sub1l 中 的 声明 来 寻找 关于 x 的 正确 声明 。 如 果 在 子 程序 Sub1 中 没有 发 现 这 种 声明 ， 搜 
索 将 继续 在 声明 子 程序 Sub1l 的 子 程序 声明 中 进行 ， 该 子 程序 被 称 为 subl 的 静态 父辈 。 如 果 在 
那里 还 没有 找到 变量 X 的 声明 ， 搜 索 将 继续 到 下 一 个 更 大 的 包含 单位 (声明 子 程序 Subl 的 父辈 
的 程序 单元 ) ， 并 依 此 类 推 ， 直 到 发 现 变 量 x 的 声明 为 止 ， 或 者 是 直到 已 经 搜索 了 最 大 程序 单元 
中 的 声明 ， 但 没有 成 功 发 现 为 止 。 在 这 种 情况 下 ， 就 发 现 了 一 个 没有 声明 的 变量 的 错误 。 子 程 
序 subl 的 静态 父 非 和 静态 父辈 的 静态 父辈 ， 由 此 往 上 直到 主 程序 ， 这 些 程序 单元 被 称 为 Subl 
的 静态 祖先 。 请 注意 ， 我 们 将 在 第 10 章 讨论 的 静态 作用 域 的 实现 技术 比 刚才 描述 的 过 程 具 有 更 
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考虑 下 面 的 Ada 程 序 : 


procedure Big is 
Xx : Integer; 
procedure Subl is 
Xx : Integer; 


begin -- Subl 开 始 

end; -- Sub1 结 束 
procedure Sub2 is 

begin -- Sub2 开 始 

a a e Aar o 

end; -- Sub2 结 束 
begin -- Big 开 始 
end; -- Big 结 束 


在 静态 作用 域 下 ， 对 Subl1 中 变量 x 的 引用 也 就 是 对 程序 Big 中 声明 的 变量 x 的 引用 。 因 为 对 
Xx 的 搜索 开始 于 引用 发 生 的 程序 Sub1， 然 而 没有 在 那里 发 现 x 的 声明 。 因 此 继续 搜索 Sub1 的 静 
态 父辈 Big， 终 于 在 那里 找到 了 Xx 的 声明 。 因 为 x 没有 在 Sub2 的 静态 祖先 中 ， 所 以 Sub1 中 声明 
的 x 能 被 忽略 。 

由 于 出 现 了 曾经 在 5.2.3 节 讨论 过 的 预定 义 名 字 ， 在 某 种 程度 上 使 得 这 个 过 程 更 加 复杂 。 在 
有 些 时 候 ， 预 定义 名 字 像 关键 字 一 样 可 以 由 用 户 重新 定义 。 因 此 ， 只 有 当 用 户 的 程序 不 包含 重 
新 定义 时 ， 才 能 够 使 用 预定 义 名 字 。 而 在 其 他 时 候 ， 预 定义 名 字 可 以 是 被 保留 的 ， 这 意味 着 对 
给 定名 字 的 意义 的 搜寻 开始 于 预定 义 名 字 表 ， 其 至 是 在 局 部 作用 域 的 声明 被 检测 之 前 。 

在 使 用 静态 作用 域 的 语言 中 ， 不 论 这 种 语言 是 否 允 许 修 套 的 子 程序 ， 一 些 变 量 的 声明 都 可 
以 对 其 他 代码 段 隐藏 起 来 。 例 如 ， 考 虑 下 面 的 C++ 框架 方法 ; 


void sub() { 
int count; 
while ( ... ) { 
int count; 
Count t+ 


} 

在 while 循 环 中 对 count 的 引用 是 对 这 个 循环 中 局 部 count 的 引用 。 在 这 种 情况 下 ， 函 数 
sub 所 再 明 的 count 对 于 while 循 环 中 的 代码 段 是 隐藏 的 。 一 般 而 言 ， 一 个 变量 声明 有 效 地 隐 
藏 了 在 较 大 的 封闭 作用 域 中 任何 同名 变量 的 声明 。 需 要 注意 的 是 ， 这 种 代码 在 C 和 C++ 中 是 合法 
的 ， 然 而 在 Java 及 C# 中 是 不 合法 的 。Java 和 C# 的 设计 人 员 相 信 仍 套 块 中 名 字 的 重用 是 漏洞 百出 
的 、 以 致 于 不 能 够 允许 这 样 使 用 。 

在 Ada 中 ， 可 以 使 用 选择 引用 来 访问 祖先 作用 域 中 的 隐藏 变量 ， 这 种 选择 引用 必须 包括 祖先 
作用 域 的 名 字 。 例 如 前 面 的 Big 程 序 ， 通 过 引用 Big .x 就 可 以 在 Subl 中 访问 在 Big 中 声明 的 Xx。 

虽然 基于 C 的 语言 不 允许 将 子 程序 嵌 套 于 其 他 子 程序 的 定义 中 ， 然 而 这 些 语言 却 具有 会 局 
变量 。 这 些 变量 声明 于 任何 子 程序 定义 之 外 。 局 部 变量 可 以 隐藏 这 些 全 局 变量 ， 就 如 同 在 Ada 
语言 中 那样 。 在 C++ 中 ， 可 以 通过 使 用 作用 域 操作 符 C) 来 访问 隐藏 的 全 局 变量 。 例 如 ， 如 果 
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x 和 是 一 个 全 局 变量 ， 它 通过 一 个 局 部 命名 的 x 而 隐藏 于 一 个 子 程序 中 ， 但 经 由 : :x 就 可 以 引用 这 
个 全 局 变量 。 
5.8.2 tk 

许多 语言 允许 在 可 执行 代码 中 定义 新 的 静态 作用 域 。 这 个 由 ALGOL 60 引 入 的 十 分 有 用 的 
概念 允许 一 段 代 码 拥 有 自己 的 局 部 变量 ， 而 这 些 局 部 变量 的 作用 域 就 是 这 段 代 码 。 这 样 的 变量 
为 典型 的 栈 动态 的 ， 因 而 当 执 行 这 个 代码 段 时 ， 就 进行 变量 的 存储 空间 分 配 ， 而 当 这 个 代码 段 
了 退出 执行 时 ， 则 进行 存储 空间 的 解除 分 配 。 我 们 将 这 段 代码 称 为 块 。 

在 Ada 语 言 中 ， 使 用 declare 子 句 进 行 块 的 说 明 ， 如 下 所 示 : 


declare Temp : Integer; 


begin 

Temp := First; 
First := Second; 
Second := Temp; 
end; 


请 注意 ， 如 果 一 条 Ada 复 合 语言 (由 begin 和 end 界 定 ) 没有 包含 声明 ， 则 不 用 包括 
declare 子 句 。 块 结构 的 语言 这 一 名 称 就 源 自 于 块 。 
基于 C 的 语言 允许 任何 复合 语句 (由 配对 的 花 括 号 界定 的 语句 系列 ) 具有 声明 ， 并 由 此 定义 
新 的 作用 域 。 这 样 的 复合 语句 就 是 块 。 例 如 ， 如 果 1ist 为 一 个 整数 数组 ， 我 们 可 以 编写 程序 : 
if (liet(i} < Iist{j]} A 
int temp; 
temp = list[i]; 
list[i] = list[j]; 
list[j] = temp; 
} 


处 理 这 些 块 产生 的 作用 域 ， 完 全 可 以 像 处 理由 子 程序 产生 的 作用 域 一 样 。 对 声明 不 在 块 中 
的 变量 的 引用 ， 可 以 通过 从 小 到 大 的 顺序 搜索 它 的 包含 作用 域 , 从 而 找到 变量 声明 。 

C++ 人 允许 变量 定义 出 现 于 函数 中 的 任何 位 置 。 当 变量 定义 出 现 的 位 置 不 在 函数 的 首部 也 不 
在 一 个 块 中 时 ， 该 变量 的 作用 域 就 是 从 这 条 定义 语句 的 位 置 直到 函数 未 尾 。 但 注意 在 C 中 ， 所 
有 在 国 数 中 的 数据 声明 如 果 不 是 在 块 中 ， 就 必须 是 在 函数 的 首部 。 

C++、Java 以 及 C# 中 的 for 语 句 允许 在 它们 的 初始 化 表达 式 中 放置 变量 定义 。 在 C++ 的 早 
期 版 本 中 ， 这 种 变量 的 作用 域 是 从 变量 定义 的 位 置 到 它 最 小 包含 块 的 未 尾 。 然 而 在 C++ 的 标准 
版 本 中 ， 仅 将 作用 域 限制 于 for 结 构 之 内 ， 这 同 Java 以 及 C# 语 言 中 的 情形 一 样 。 考 虑 下 面 的 框 
RTE: 


void fun() { 
for (int count = 0; count < 10; count++){ 
} 


} 
在 早期 版 的 C++ 中 ，count 作 用 域 是 从 for 语 句 到 方法 结束 的 地 方 。 在 后 续 版 中 ， 像 Java 和 
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C# 一 样 ，count 的 作用 域 是 从 for 语 句 到 其 结束 的 地 方 。 

C++、Java 以 及 C# 中 的 类 对 待 它 们 的 实例 变量 的 方式 与 对 待定 义 于 它们 的 方法 之 中 的 变量 
的 方式 不 同 。 一 个 定义 于 方法 中 的 变量 的 作用 域 开始 于 它 的 定义 位 置 。 然 而 ， 不 论 一 个 实例 或 
类 变量 是 在 类 中 的 什么 位 置 定义 的 ， 它 的 作用 域 是 整个 类 ，。 

在 面 问 对象 的 语言 中 ， 类 和 方法 的 定义 会 产生 艇 套 静 态 作用 域 。 这 些 将 在 第 12 章 中 讨论 。 
在 Ruby 中 ， 变 量 名 的 形式 表示 了 它们 的 作用 域 ， 因 为 Ruby 是 一 种 完全 的 面向 对 象 语言 ， 而 且 它 
的 作用 域 与 面向 对 象 构建 关联 。 这 也 将 在 第 12 章 中 讨论 。 


5.8.3 静态 作用 域 的 评估 


静态 作用 域 提 供 了 一 种 非 局 部 访问 的 方法 。 在 许多 情况 下 ， 这 是 一 种 相当 好 的 方法 ， 但 也 
仓 在 问题 。 考 虑 图 $-1 所 示 的 框架 程序 。 在 这 个 例子 中 ， 假 设 所 有 作用 域 都 由 主 程序 及 过 程 的 定 
SOFT, 

这 个 程序 包含 主 程序 main 的 一 个 总 作用 域 ， 它 有 两 个 过 程 A 和 B， 它 们 在 main 中 定义 自己 
的 作用 域 。 在 A 的 内 部 是 过 程 C 和 D 的 作用 域 ， 而 在 B 的 内 部 是 过 程 E 的 作用 域 。 我 们 假设 ， 必 要 
的 数据 以 及 过 程 访问 决定 这 个 程序 的 结构 。 所 要 求 的 过 程 访问 为 main 能 够 调用 A 和 B，A 能 
调用 C 和 D，B 能 够 调用 A 和 E。 

可 以 将 这 个 程序 的 结构 方便 地 表示 为 一 棵 树 ， 其 中 的 每 个 节点 代表 一 个 过 程 和 一 个 作用 域 。 
图 5-2 显 示 了 图 5-1 中 程序 的 树 结构 。 这 个 程序 结构 看 上 去 可 能 像 是 一 种 非常 自然 的 程序 组 织 ， 
它 清 楚 地 反映 了 设计 的 需要 。 然 而 ， 图 5-3 给 出 了 这 个 系统 可 能 的 过 程 调用 ， 该 图 显示 ， 可 能 的 
调用 会 比 要 求 的 调用 多 。 


main 


main 
Poa 





D © 


图 5-3 图 5-1 中 程序 的 可 能 调用 图 图 5-4 图 5-1 中 程序 所 需要 的 调用 图 
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图 5-4 显 示 了 上 面 例子 中 的 程序 所 需要 的 调用 。 图 $-3 和 图 5-4 之 间 的 差别 说 明 ， 在 这 个 特定 
应 用 之 中 有 许多 可 能 的 调用 是 不 需要 的 。 

程序 人 员 有 可 能 错误 地 调用 一 个 不 该 被 调用 的 子 程序 ， 而 这 个 调用 不 会 被 编译 器 检查 为 错 
误 。 这 使 得 错误 的 发 现 被 推迟 到 运行 时 ， 从 而 提高 了 改正 错误 的 代价 。 因 此 ， 应 该 将 过 程 的 访 
问 限制 在 必需 的 范围 之 内 。 

太 多 的 数据 存 取 会 造成 问题 。 例 如 ， 所 有 在 主 程序 中 声明 的 变量 不 论 是 否 需要 ， 对 所 有 过 
程 都 是 可 见 的 ， 并 且 无 法 避免 。 

为 了 说 明 静 态 作 用 域 的 另 一 种 问题 ， 考 虑 下 面 的 情况 。 假 设 在 开发 与 测试 了 上 面 的 程序 
之 后 ， 需 要 对 它 的 说 明 进 行 修改 。 特 别 是 ， 假 设 现在 过 程 E 必 须 能 够 存 取 D 的 作用 域 中 的 一 些 
变量 。 提 供 这 种 存 取 的 一 种 方式 就 是 将 E 移 到 D 的 作用 域 之 内 。 但 是 这 样 做 之 后 E 就 不 再 能 
访问 B 的 作用 域 ， 而 这 种 访问 多 半 是 需要 的 (不 然 为 什么 原来 将 E 放 在 那里 ? ) 。 另 一 种 解决 的 
方式 是 将 在 D 中 定义 而 被 3 需求 的 变量 移 人 main。 这 样 就 能 够 允许 所 有 过 程 对 这 些 变量 进 和 TF 
取 ， 这 会 超过 需要 ， 并 由 此 产生 错误 存 取 的 可 能 。 例 如 ， 可 能 将 在 一 个 过 程 中 错误 拼写 的 标 
识 符 当 作 基 对 一 个 包含 作用 域 中 标识 符 的 引用 ， 而 不 是 将 其 检查 为 错误 。 此 外 ， 假 设 变量 x 被 
移 到 main 中 ， 而 且 D 和 E 都 需要 x， 但 是 假设 在 A 里 也 有 一 个 命名 为 x 的 变量 。 这 就 使 得 正确 的 
x 对 于 它 原来 的 所 有 者 D 隐 藏 了 起 来 。 将 x 的 声明 移 到 main 中 的 最 后 一 个 问题 是 ， 变 量 声明 远 
离 变量 的 使 用 将 有 损 于 可 读 性 。 

与 静态 作用 域 相关 的 变量 可 见 性 问题 也 出 现 于 子 程序 的 访问 之 中 。 在 图 5-2 的 树 中 ， 假设 由 
于 改变 了 一 些 说 明 ， 过 程 E 需 要 调用 过 程 D。 这 只 能 够 通过 移动 D， HDA KE Fmainh RSE 
成 。 假 设 R 或 C 也 需要 D， 那 么 D 也 将 会 失去 对 在 &A 中 定义 的 变量 的 存 取 。 如 果 是 重复 地 使 用 这 种 
解决 方法 ， 会 导致 在 程序 的 开始 有 一 长 列 低层 次 的 功能 过 程 。 

因此 要 绕 开 静态 作用 域 的 限制 ， 会 导致 程序 设计 的 结果 与 初期 设想 产生 极 大 差异 ， 其 至 对 
于 程序 中 没有 改变 的 部 分 也 会 如 此 。 设 计 人 员 因 此 使 用 比 所 需要 的 多 得 多 的 全 局 变量 。 所 有 的 
过 程 都 使 用 全 局 变量 ， 而 不 是 较 次 层次 的 伐 套 ， 而 且 最 终 都 伐 套 在 同一 个 层次 ， 即 主 程序 
中 。9 此 外 ， 最 后 的 设计 可 能 是 鳖 脚 和 不 自然 的 ， 不 能 反映 作为 设计 基础 的 概念 设计 。 静态 作 
用 域 所 存在 的 上 述 这些 问 题 以 及 其 他 缺点 ， 在 (Clarke, Wileden and Wolf，1980) 中 进行 了 详 
细 讨 论 。 解决 静态 作用 域 问题 的 一 个 办 法 是 将 要 在 第 11 章 讨论 的 一 种 封装 结构 ， 现 在 这 种 结构 
已 经 被 包含 在 许多 新 型 的 语言 中 。 


5.8.4 动态 作用 域 


在 APL、SNOBOL4 和 LISP 的 早期 版 本 中 ， 变量 的 作用 域 是 动态 的 。Perl 和 COMMON | 


LISP 也 允许 变量 具有 动态 作用 域 ， 尽 管 这 两 种 语言 也 使 用 静态 作用 域 。 动 态 作 用 域 基于 子 程 
序 的 调用 序列 ， 而 不 是 基于 作用 域 相 互 之 间 的 空间 关系 。 因 此 这 种 作用 域 只 能 够 在 运行 时 得 
以 确定 。 
让 我 们 再 次 考虑 第 5.8.1 节 中 的 Big 过 程 ， 我 们 将 它 再 次 显示 如 下 : 
procedure Big is 
X : Integer; 
procedure Subl is 
X : Integer; 
begin -- Subl 开 始 


日” 看 起 来 像 C 程 序 的 结构 ， 不 是 吗 ? 


tO 
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end; -- Subl 结 束 
procedure Sub2 is 

begin -- Sub2 开 始 

ss 

end; -- Sub2 结 束 
begin -- Big 开 始 
end; -- Big#t 


假设 动态 作用 域 的 规则 适用 于 非 局 部 引用 。 在 Sub1 中 引用 标识 符 X 的 意义 为 动态 的 ， 即 
它 不 能 够 在 编译 时 确定 。 子 程序 调用 的 顺序 将 决定 对 这 两 个 x 的 声明 中 任何 一 个 x 的 引用 。 

一 种 能 够 在 运行 时 确定 xX 正确 意义 的 方法 是 从 局 部 声明 开始 搜索 。 这 也 是 静态 作用 域 的 开 
始 方式 ， 然 而 除 此 以 外 ， 这 两 种 技术 之 间 再 也 没有 相似 之 处 。 当 局 部 声明 的 搜索 不 成 功 时 ， 搜 
案 将 进行 到 其 动态 父辈 〈 即 调用 程序 ) 的 声明 。 如 果 在 那里 也 没有 发 现 X 的 声明 ， 搜 索 又 就 继 
续 到 这 个 程序 的 动态 父辈 ， 依 此 类 推 ， 直 到 找到 X 的 声明 为 止 。 如 果 在 任何 一 个 动态 祖先 中 都 
没有 发 现 X 的 声明 ， 它 就 是 一 个 运行 时 错误 。 

考虑 上 面 例子 中 对 Subl 的 两 种 不 同 的 调用 序列 。 第 一 种 情形 ，Big 调 用 sub2，sub2 再 调 
用 Sub1。 在 这 种 情况 下 ， 搜 索 过程 从 局 部 程序 Sub1 到 它 的 调用 者 sub2， 而 在 Sub2 中 找到 了 x 
的 声明 ， 所 以 ， 在 这 种 情况 下 在 Subl 中 引用 的 x 是 在 Sub2 中 声明 的 x。 第 二 种 情形 ， 如 果 Big 
直接 调用 Sub1。 在 这 种 情况 下 ，Sub1 的 动态 父辈 是 Big， 因 而 所 引用 的 是 在 Big 中 声明 的 X 

请 注意 ， 如 果 我 们 使 用 的 是 静态 作用 域 ， 则 不 论 是 上 面 讨论 的 哪 一 种 调用 序列 ， 对 于 sub1l 
中 x 的 引用 都 是 引用 Big 中 的 Xx。 

Perl 语 言 中 的 动态 作用 域 是 非 同 寻常 的 一 一 虽然 它 在 语义 上 是 传统 的 动态 作用 域 (参见 程序 
设计 练习 题 1 )， 但 事实 上 却 与 在 本 节 讨 论 的 不 完全 一 样 。 


5.8.5 动态 作用 域 的 评估 


动态 作用 域 对 于 程序 设计 的 影响 极为 深刻 。 程 序 语句 可 见 的 非 局 部 变量 的 正确 属性 不 能 
静态 地 确定 。 此 外 ， 这 样 的 变量 并 非 总 是 一 样 的 。 包 含 非 局 部 变量 引用 的 子 程序 中 的 语句 可 以 
在 子 程序 的 不 同 执行 期 间 引 用 不 同 的 非 局 部 变量 。 而 几 种 程序 设计 的 问题 都 是 直接 由 动态 作用 
域 产生 的 。 

首先 ， 从 子 程序 的 执行 开始 到 执行 结束 的 期 间 ， 该 子 程序 中 的 局 部 变量 对 于 任何 其 他 正在 
执行 的 子 程序 都 是 可 见 的 ， 不 论 这 些 子 程序 的 接近 程度 如 何 。 还 没有 任何 办 法 可 以 保护 局 部 变 
量 避 免 这 种 可 存 取 性 。 子 程序 总 是 在 先前 被 调用 的 程序 的 环境 中 执行 ， 只 要 这 些 程序 的 执行 还 
BARR: 所以， 动态 作用 域 导致 比 静态 作用 域 更 低 的 程序 可 靠 性 。 

动态 作用 域 的 第 二 个 问题 是 不 能 进行 非 局 部 变量 引用 的 静态 类 型 检测 。 这 个 问题 起 源 于 不 
能 静态 地 决定 非 局 部 变量 引用 的 声明 。 

动态 作用 域 也 使 得 程序 的 可 读 性 降低 ， 因 为 必须 知道 子 程序 的 调用 顺序 ， 才 能 确定 非 局 部 
变量 引用 的 意义 。 这 对 于 人 类 读者 而 言 实际 上 是 不 可 能 的 。 

最 后 ， 在 动态 作用 域 的 语言 中 ， 对 非 局 部 变量 的 存 取 远 比 使 用 静态 作用 域 时 对 非 局 部 恋 量 
的 存 取 所 耗 时 间 长 得 多 。 我 们 将 在 第 10 章 就 其 原因 给 出 解释 。 

但 动态 作用 域 并 不 是 没有 优点 。 在 某 些 情形 下 ， 从 一 个 子 程序 传递 到 另 一 个 子 程序 的 参数 ， 
仅仅 征 在 调用 程序 中 定义 的 变量 。 然 而 在 动态 作用 域 语言 中 ， 并 不 需要 传递 这 些 参数 ， 因 为 它 
们 对 被 调用 的 子 程 序 是 隐 式 可 见 的 。 
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不 难 理解 为 什么 动态 作用 域 不 如 静态 作用 域 使 用 广泛 。 使 用 静态 作用 域 语言 编写 的 程序 比 
使 用 动态 作用 域 语言 编写 的 等 同 程序 更 易 读 、 更 可 靠 ,而 且 运 行 速度 更 快 。 正 是 出 于 这 样 的 原 
因 ， 在 LISP 最 新 方言 中 ， 用 静态 作用 域 取代 了 动态 作用 域 。 关 于 静态 作用 域 及 动态 作用 域 的 实 
现 方法 ， 将 在 第 10 章 讨论 。 


5.9 作用 域 与 生存 期 


有 时 ， 变 量 的 作用 域 与 生存 期 似乎 是 相关 的 。 例 如 ， 考 虑 一 个 在 不 包含 方法 调用 的 Java 方 
法 中 声明 的 变量 。 这 个 变量 的 作用 域 是 从 它 的 声明 到 这 个 方法 的 未 尾 。 它 的 生存 期 则 开始 于 方 
法 被 进入 之 时 ， 终止 于 方法 执行 完毕 之 时 。 虽 然 变 量 的 作用 域 与 生存 期 显然 不 是 同一 件 事情 : 
静态 作用 域 是 文本 的 或 空间 的 概念 ， 而 生存 期 是 时 间 的 概念 ， 但 至 少 它们 在 这 个 情形 下 似乎 是 
相关 的 。 

作用 域 与 生存 期 之 间 这 种 表面 上 的 关系 在 其 他 情况 下 并 不 存在 。 例 如 在 C 和 C++ 中 ， 一 个 在 
国 数 中 由 修饰 符 static 声 明 的 变量 被 静态 地 绑 定 于 函数 的 作用 域 ， 同 时 也 被 静态 地 绑 定 于 存 
储 空 间 。 所 以 这 个 变量 的 作用 域 是 静态 的 ， 并 且 对 这 个 函数 为 局 部 的 ， 但 它 的 生存 期 却 扩展 到 
了 整个 程序 的 执行 期 间 。 

当 涉 及 到 子 程序 调用 时 ， 作 用 域 和 生存 期 也 是 无 关 的 。 考 虑 下 面 这 些 C++ 函数 ; 

void printheader() { 

3 J> printheader 结 束 */ 


void compute() { 
int sum; 


printheader(); 
} /* compute 结 束 */ 


变量 sum 的 作用 域 完 全 包含 在 函数 compute 之 中 。 尽 管 printheader 在 函数 compute 的 
运行 中 则 执行 ， 但 sum 的 作用 域 却 没有 扩展 到 printheader 函 数 体 中 。 然 而 ，sum 的 生存 期 则 
锌 扩展 到 了 printheader 执 行 的 整个 期 间 。 在 printheader 被 调用 之 前 ， 无 论 将 变量 sum 绑 
定 于 什么 存储 空间 ， 这 种 绑 定 在 Printheadez 的 执行 中 间 以 及 执行 之 后 都 将 继续 。 


5.10 引用 环境 


一 条 语句 的 引用 环境 是 这 条 语句 中 所 有 可 见 变量 的 集合 。 在 静态 作用 域 的 语言 中 ， 一 条 语 
名 的 引用 环境 是 在 它 的 局 部 作用 域 所 声明 的 变量 和 在 它 的 祖先 作用 域 所 声明 的 所 有 可 见 变量 的 
集合 。 在 这 种 语言 中 编译 一 条 语句 时 ， 需 要 有 关 这 条 语句 的 引用 环境 ， 这 样 就 能 够 产生 代码 和 
数据 结构 ， 以 便 在 运行 时 对 来 自 其 他 作用 域 的 变量 进行 引用 。 我 们 将 在 第 10 章 讨论 如 何在 静态 
作用 域 语 言 以 及 动态 作用 域 语言 中 实现 非 局 部 变量 引用 的 技术 。 

在 Ada 语 言 中 ， 可 以 通过 过 程 定义 来 产生 作用 域 。 一 条 语句 的 引用 环境 包括 局 部 变量 ， 再 
加 上 铀 套 这 条 语句 的 程序 中 所 声明 的 所 有 变量 (不 包括 被 较 近 的 过 程 声明 所 隐藏 的 非 局 部 作用 
域 中 的 变量 ) 。 每 一 条 过 程 定义 产生 一 个 新 的 作用 域 以 及 由 此 而 来 的 新 环境 。 现 在 考虑 下 面 的 
Ada 框架 程序 : 


procedure Example is 
A, B : Integer; 
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procedure Subl is 
X, Y : Integer; 
begin -- Subl 开 始 


end; -- Subl 结 束 
procedure Sub2 is 
X : Integer; 


procedure Sub3 is 
X =: Integer; 


begin -- Sub3 开 始 
。。。 See eee 2 
end; -- Sub3 结 束 
begin -- Sub2 开 始 
< 一 -—- 3 
end; -- Sub2 结 束 
begin -- Example 开 始 
Re 4 
end. -- Example 结 束 
标记 了 的 程序 中 不 同 点 的 引用 环境 如 下 : 
te 引用 环境 
1 Subl 中 的 Xx 和 Y，Example 中 的 A 和 B 
2 Sub3 中 的 Xx (Sub2 中 的 x 是 隐藏 的 ) ，Example 中 的 A 和 B 
3 Sub2 中 的 Xx，Example 中 的 A 和 B 


现在 来 考虑 这 个 框架 程序 里 的 变量 声明 。 首 先 往 意 ， 虽 然 Sub1 的 作用 域 层 次 高 于 Sub3 的 
作用 域 层次 〈 它 的 和 藤 套 比较 瑟 ) ， 但 是 Sub1 的 作用 域 却 不 是 Sub3 的 作用 域 的 静态 祖先 ， 因 而 
Sub3 不 能 存 取 在 Sub1 中 声明 的 变量 。 这 种 现象 的 原因 是 ， 在 Sub1 中 声明 的 变量 是 栈 动 态 的 ， 
因此 在 Sub1 没 有 被 执行 之 前 ， 这 些 变量 还 役 有 与 存储 空间 绑 定 。 又 因为 Sub1 设 有 被 执行 之 前 
Sub3 可 能 已 经 被 执行 ， 所 以 Sub3 就 不 能 存 取 Sub1 中 的 变量 ， 这 些 变量 不 一 定 在 Sub3 的 执行 
期 间 就 与 存储 空间 绑 定 了 。 

如 果 已 经 开始 一 个 子 程序 的 执行 ， 并 且 该 执行 还 没有 终止 ， 就 称 这 个 子 程序 是 活跃 的 。 在 
动态 作用 域 的 语言 中 ， 一 条 语句 的 引用 环境 是 局 部 声明 的 变量 ， 加 上 当前 活跃 的 其 他 子 程序 中 
的 所 有 变量 。 一 些 活 跃 子 程序 中 的 变量 可 能 对 引用 环境 为 隐藏 的 。 最 近 的 子 程序 活动 可 以 具有 
变量 声明 ， 它 隐藏 了 前 一 个 子 程序 活动 中 具有 的 同名 变量 。 

考虑 下 面 的 程序 例子 。 假 设 其 中 仅 有 的 函数 调用 为 main 调 用 sub2，sub2 再 调用 sub1l。 

void subl() { 

int a, b; 


} ft subl 结束 */ 
void sub2() { 

int b, c; 

subl; 

} /* sub2 结束 */ 
void main() { 

int c, d? 


subis 
} /* main 结束 */ 
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已 标记 的 程序 中 不 同 点 的 引用 环境 如 下 : 


点 引用 环境 
1 subl 中 的 a 和 b，sub2 中 的 c， main 中 的 d (main 中 的 c 以 及 sub2 中 的 b 是 隐藏 的 ) 
2 sub2 中 的 b 和 c，main 中 的 d (main 中 的 c 是 隐藏 的 ) 
3 main 中 的 c 和 qd 
5.11 命名 常量 


命名 常量 是 这 样 一 种 变量 ， 它 只 与 值 绑 定 一 次 。 命 名 常量 的 用 处 在 于 它 有 助 于 增进 程序 的 
可 读 性 与 可 靠 性 。 例 如 ， 通 过 使 用 名 字 pi 而 不 是 使 用 常量 3.14159， 可 读 性 可 以 得 到 改进 。 

使 用 命名 常量 的 另 一 个 优点 是 将 程序 参数 化 ， 例 如 一 个 程序 处 理 固定 数目 的 数据 值 100。 
这 样 的 程序 通常 在 许多 位 置 使 用 常量 100， 来 声明 数组 下 标 范围 或 用 于 循环 控制 限制 。 考 虑 下 面 (236) 
的 Java 框 架 程序 段 : 


void example() { 
int[] intList = new int[100]; 
String[] strList = new String[100]; 
fos (index = 0; index < 100; index++) { 
} 
for (index = 0; index < 100; index++) { 
} 
aan = sum / 100; 
} 


当 必 须 修改 这 个 程序 以 处 理 不 同 数 目的 数据 时 ， 就 必须 找到 并 修改 所 有 出 现 数字 100 的 位 
置 。 在 处 理 一 个 大 程序 时 ， 这 可 能 会 很 麻烦 而 且 很 容易 出 错 。 一 种 较 容 易 并 且 可 靠 的 方法 是 使 
用 一 个 命名 常量 ， 如 下 面 的 程序 的 用 法 : 
void example() { 
final int len = 100; 
int[] intList = new int[len]; 
String[] strList = new String[len]; 
for (index = 0; index < len; index++) { 
} 
for (index = 0; index < len; index+t+) { 
} 
RE = sum / len; 
} 


现在 ， 不 论 这 个 数字 在 程序 中 被 使 用 多 少 次 ， 当 必须 进行 改变 时 ， 只 需要 修改 一 行 代码 
(变量 len)。 这 是 抽象 所 具有 的 优点 的 男 一 个 例子 。 名 字 len 是 数组 元 素 的 数目 以 及 循环 重复 
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数目 的 抽象 。 这 个 例子 说 明 命 名 常量 如 何 有 助 于 程序 的 修改 。 


Fortran 95 只 人 允许 用 第 量 表达 式 作为 其 命名 稼 量 的 值 。 这 些 常 量 表 达 式 可 以 包含 先前 定义 的 
命名 币 量 、 靖 量 值 以 及 操作 符 。 在 Fortran 95 中 对 于 常量 和 和 常量 表达 式 实施 这 种 限制 的 原因 ， 是 
因为 它 将 值 与 命名 稍 量 静态 地 绑 定 。 在 使 用 值 的 静态 绑 定 的 语言 中 ， 有 时 也 称 命名 常量 为 说 明 
常量 (manifest constant ) 。 

Ada 和 C++ 人 允许 将 值 动态 地 绑 定 于 命名 常量 。 这 样 就 能 够 允许 含有 变量 的 表达 式 对 声明 中 的 
命名 和 量 赋值 。 例 如 这 样 一 条 C++ 语句 : 

const int result = 2 * width + 1; 

将 result 声 明 为 整数 类 型 的 命名 常量 ， 它 的 值 被 设 为 表达 式 2 * width+1 的 值 ， 当 
result 被 分 配 并 与 值 绑 定时 ， 变 量 width 的 值 必须 为 可 见 的 。 

Java 也 爷 许 将 值 动态 地 绑 定 于 命名 常量 。 在 Java 中 ， 使 用 保留 字 final1 来 定义 命名 常量 
(如 前 面 的 例子 所 示 )。 可 以 在 声明 语句 中 或 者 在 后 面 的 赋值 语句 中 ， 将 初始 值 赋 给 命名 常量 。 
可 以 使 用 任何 表达 式 来 指明 被 赋 的 值 。 

C# 有 两 种 命名 常量 ， 用 const 定 义 的 命名 常量 ， 以 及 用 readon1ly 定 义 的 命名 常量 。const- 
命名 币 量 隐 式 、 静 态 地 与 值 绑 定 。 也 就 是 说 ， 它 们 在 编译 时 与 值 绑 定 ， 这 意味 着 这 些 值 只 能 够 
通过 字面 量 或 其 他 const 成 员 来 指定 。 而 readonly- 命 名 常量 则 是 动态 地 与 值 绑 定 ， 它 们 可 以 
在 声明 中 或 者 在 静态 构造 函数 中 赋值 。 因此， 如 果 程 序 需要 一 个 常量 值 对 象 ， 该 对 象 值 在 程 
序 的 每 一 次 使 用 中 都 是 相同 的 ， 那 么 将 会 用 到 const 常 数 。 然 而 ， 如 果 程 序 需要 一 个 常量 值 对 
家 ， 该 对 象 值 只 在 创建 对 象 时 确定 ， 并 且 随 着 程序 的 不 同 执 行情 况 而 改变 ， 那 么 此 时 将 用 到 
readonly E, 

Ada 人 允许 枚 举 类 型 与 结构 类 型 的 命名 常量 ， 这 些 将 在 第 6 章 进 行 讨论 。 

关于 将 值 与 命名 常量 绑 定 的 讨论 ， 自 然 地 导致 了 变量 初始 化 的 主题 ， 因 为 将 值 绑 定 于 一 个 
命名 向 量 的 过 程 与 变量 的 初始 化 过 程 相 同 ， 只 是 前 者 为 永久 性 的 。 

在 许多 情况 下 ， 如 果 变 量 在 开始 执行 具有 变量 声明 的 程序 或 子 程序 之 前 ， 就 已 经 具有 了 值 ， 
那 将 是 较为 方便 的 。 在 变量 与 存储 空间 绑 定时 ， 这 个 变量 与 值 的 绑 定 就 称 为 变量 的 初始 化 .如 
采 变 量 被 静态 地 与 存储 空间 绑 定 ， 而 且 绑 定 与 初始 化 都 发 生 在 运行 时 之 前 ， 在 这 些 情况 下 ， 初 
始 值 只 能 够 被 声明 为 字面 常量 ， 或 者 是 仅 包含 命名 常量 的 非 字面 常量 操作 数 的 表达 式 。 如 果 对 
存储 空间 的 绑 定 是 动态 的 ， 则 初始 化 过 程 也 会 是 动态 的 ， 并 且 初 始 值 可 以 为 任意 表达 式 。 

在 大 多 数 语言 中 ， 初 始 化 是 在 产生 变量 的 声明 中 指定 的 。 例 如 在 C++ 中 ， 我 们 可 能 有 


int sum = 0; i 
int* ptrSum = &sum; 
char name[] = "George Washington Carver"; 


小 结 


大 、 小 写 敏感 性 以 及 名 字 与 特殊 字 (保留 字 或 关键 字 ) 的 关系 ， 是 有 关 名 字 的 设计 问题 。 

变量 可 以 由 六 种 属性 来 刻画 : 名 字 、 地 址 、 值 、 类 型 、 生 存 期 、 作 用 域 。 

别名 为 绑 定 于 同一 个 存储 地 址 的 两 个 或 多 个 名 字 。 别 名 被 认为 有 损 语言 的 可 靠 性 ， 然 而 又 很 难 从 一 
种 语言 中 完全 消除 。 

绑 定 契 属 性 与 程序 实体 的 关联 。 关 于 属性 与 实体 的 绑 定时 间 的 知识 ， 对 于 理解 程序 设计 语言 的 语义 


日 ”C# 稻 态 构 造 函 数 运行 在 实例 化 类 之 前 的 一 些 非 关键 时 刻 。 
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十 分 关键 。 绑 定 可 以 是 静态 的 或 者 动态 的 。 显 式 声 明 或 者 隐 式 声明 提供 一 种 说 明 变 量 与 类 型 的 静态 绑 定 的 
方式 。 一 般 而 言 ， 动 态 绑 定 可 以 允许 较 大 的 灵活 性 ， 但 却 是 以 可 读 性 、 效 率 以 及 可 靠 性 作为 代价 的 。 
通过 考虑 标量 变量 的 生存 期 ， 可 以 将 它们 划分 为 四 类 : 静态 类 、 栈 动态 类 、 显 式 堆 动 态 类 、 隐 式 堆 
动态 类 。 
强 类 型 化 的 概念 是 要 求 能 够 发 现 所 有 的 类 型 错误 。 强 类 型 化 的 优点 是 增加 可 徘 性 。 
语言 的 类 型 等 价 规则 决定 在 语言 的 结构 化 类 型 中 什么 操作 是 合法 的 。 名 字 类 型 等 价 和 结构 类 型 等 价 
是 定义 类 型 等 价 的 两 种 基本 方法 。 
静态 作用 域 是 ALGOL 60 及 其 大 部 分 后 继 语言 的 一 个 主要 特性 。 它 为 允许 子 程序 中 非 局 部 变量 的 可 见 
性 提供 了 一 种 有 效 方法 。 动 态 作用 域 比 静态 作用 域 提 供 了 更 多 灵活 性 ， 但 却 是 以 可 读 性 、 可 靠 性 以 及 效率 
作为 代价 。 
一 条 语句 的 引用 环境 是 所 有 对 这 条 语句 为 可 见 的 变量 的 集合 。 
命名 篆 量 就 是 与 值 仅 绑 定 一 次 的 变量 。 
复习 题 
1. 名 字 的 设计 问题 是 什么 ? 
2. 大 、 小 写 敏感 的 名 字 具 有 什么 法 在 危险 ? 
3. 保 留 字 比 关 键 字 好 在 哪些 方面 ? 
4. 什么 是 别名 ? 
5. 哪 一 类 C++ 的 引用 变量 总 是 别名 ? 
6. 什 么 是 变量 的 左 值 ? 什么 是 变量 的 右 值 ? 
7. 定 义 绑 定 与 绑 定时 间 。 
8. 在 语言 的 设计 以 及 实现 之 后 ， 在 一 个 程序 中 哪 四 个 时 间 可 以 发 生 绑 定 ? 
9. 定义 静态 绑 定 与 动态 绑 定 。 
10. 隐 式 声明 有 哪些 优点 与 缺点 ? 
11. 动 态 类 型 绑 定 有 哪些 优点 与 缺点 ? 
12. 定义 静态 、 栈 动态 、 显 式 堆 动态 和 隐 式 堆 动态 的 变量 。 它 们 的 优点 与 缺点 分 别 是 什么 ? 
13. 定义 强制 转换 、 类 型 错误 、 类 型 检测 和 强 类 型 化 。 
14. 定 义 名 字 类 型 等 价 和 结构 类 型 等 价 。 什 么 是 它们 之 间 相 对 的 优点 ? 
15. Ada 派 生 类 型 与 Ada 子 类 型 之 间 有 什么 不 同 ? 
16. 定义 生存 期 、 作 用 域 、 静 态 作 用 域 和 动态 作用 域 。 
17. 一 个 静态 作用 域 的 程序 中 关于 非 局 部 变量 的 引用 是 如 何 与 它 的 定义 相关 联 的 ? 
18. 什么 是 静态 作用 域 中 的 普遍 问题 ? 
19. 什么 是 语句 的 引用 环境 ? 
20. 什么 是 子 程序 的 静态 祖先 ? 什么 是 子 程序 的 动态 祖先 ? 
21. 什么 是 程序 块 ? 
22. 动态 作用 域 的 优点 与 缺点 是 什么 ? 
23. 命名 常量 的 优点 是 什么 ? 


练习 题 
1. 从 下 列 标识 符 形 式 中 ， 确 定 哪 一 种 具有 最 好 的 可 读 性 ， 并 给 出 理由 。 
SumOfSales 


sum_of sales 
SUMOFSALES 


N 
‘DO 


N 


Bs 
3. 


~ O 


Oo 
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一 些 程序 设计 语言 是 无 类 型 的 。 一 种 没有 类 型 的 语言 具有 哪些 明显 的 优点 和 缺点 ? 

Fortran 中 Equivalence 语 句 的 一 种 通常 用 法 如 下 : 可 以 将 一 种 包含 大 量 数值 的 数组 用 作 子 程序 的 参数 。 
这 种 数组 包含 了 许多 相互 无 关 的 不 同 变 量 ， 而 不 只 是 相同 变量 的 副本 的 集合 。 之 所 以 将 它 表示 为 数组 ， 
征 为 了 能 够 减少 在 参数 传递 中 所 需要 名 字 的 数目 。 在 子 程序 中 使 用 较 长 的 Egquivalence 语 和 句 对 各 种 不 
同 的 数组 元 素 产生 有 意义 的 名 字 作 为 别名 ， 以 增加 子 程序 代码 的 可 读 性 。 你 认为 这 是 否 是 一 个 好 主 
意 ? 有 什么 不 同 的 方法 可 以 替代 别名 ? 


.用 你 所 知道 的 一 种 语言 来 编写 一 条 包含 一 个 算术 操作 符 的 简单 赋值 语句 。 对 于 这 条 语句 中 的 每 一 种 成 


分 ， 列 出 执行 请 名 时 用 来 确定 语义 所 需要 的 各 种 不 同 的 绑 定 。 并 且 对 其 中 的 每 一 种 绑 定 ， 指 出 语言 
的 绑 定时 间 。 


.动态 类 型 绑 定 与 隐 式 堆 动 态 变量 紧密 关联 。 请 解释 这 种 关系 。 
. 摘 述 在 子 程序 中 历史 敏感 变量 具有 实用 意义 的 一 种 情形 。 
. 查阅 Gehani 在 文献 (Gehani, 1983) 中 所 给 出 的 强 类 型 的 定义 ， 并 将 它 与 本 章 给 出 的 定义 相 比 较 ， 


们 有 哪些 不 同 ? 


. 考虑 下 面 的 Ada 框 架 程序 


procedure Main is 
X : Integer; 
procedure Sub3; -- 这 是 Sub3 的 声明 ， 它 允许 Sub1 调 用 Sub3 
procedure Subl is 
X : Integer; 
procedure Sub2 is 


begin -- Sub2 开 始 
end; -- Sub2 结 束 
begin -- subl 开 始 
end; -- Subl 结 束 
procedure Sub3 is 
begin -- Sub3 开 始 
end; -- Sub3 结 束 
begin -- Main 开 始 
end; -- Main 结 束 


假设 这 个 程序 的 执行 遵循 下 面 的 顺序 : 
Main 调用 Subl 
Subl 调用 Sub2 
Sub2 调用 Sub3 


4. 假设 是 静态 作用 域 ， 其 中 哪 一 个 x 的 声明 对 于 下 列 x 的 引用 是 正确 的 : 
i. Subl 
ii. Sub2 
ill. Sub3 
b. 假设 是 动态 作用 域 ， 重 复 a 中 的 问题 。 
9. 假设 下 面 的 Ada 程 序 已 经 使 用 静态 作用 域 规则 进行 过 编译 和 运行 ，。 任 过 程 Sob1 中 将 输出 什么 样 的 x 什 ? 
而 在 动态 作用 域 规 则 之 下 ， 在 过 程 sub1l 中 又 将 输出 什么 样 的 x 值 ? 


procedure Main is 
X : Integer; 
procedure Subl is 


AF, FR, RERAMA 


begin -- Subl 开 始 
Put(X)})? 
end; -- Subl 结 束 


procedure Sub2 is 
X : Integer; 


begin -- Sub2 开 始 
X := 10; 
Subl 
end; -- Sub2 结 束 
begin -- Main 开 给 
X := 53 
Sub2 
end; -- Main 结 束 


10. 考虑 下 面 的 程序 : 
procedure Main is 
X, Y, Z : Integer; 
procedure Subl is 
A, Y, Z : Integer; 
procedure Sub2 is 
A, B, Z : Integer; 


begin -- Sub2 开 始 
end; -- Sub2 结 束 
begin -- Subl 开 始 


end; -- Subl 结 束 
procedure Sub3 is 
A, X, W : Integer; 


begin -- Sub3 开 始 

end; -- Sub3 结 束 
begin -- Main 开 始 
end; -- Main 结 束 


列 出 所 有 在 Subl1、Sub2 和 sub3 的 程序 体 中 可 见 的 变量 ， 连 同 声明 这 些 变 量 的 程序 单元 ， 假 设 使 用 的 


ER aS TE FAK 
11. 考虑 下 面 的 程序 : 
procedure Main is 
X, Y, Z : Integer; 
procedure Subl is 
A, Y, Z : Integer; 
begin -- Sub1 开 始 
end; -- Subl 结 束 
procedure Sub2 is 
A, X, W : Integer; 
procedure Sub3 is 
A, B, Z : Integer; 


begin -- Sub3 开 始 
end; -- Sub3 结 束 
begin -- Sub2 开 始 


end; -- Sub2 结 束 
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begin -- Main 开 始 


saa: _ Main 结 束 
列 出 所 有 在 Sub1、Sub2 和 Sub3 的 程序 体 中 可 见 的 变量 ， 连 同 声明 这 些 变量 的 程序 单元 ， 假 设 使 用 的 
是 静态 作用 域 。 

12. 考虑 下 面 的 C 程序 : 


void fun(void) { 
int a, b, cs /* #M1 wy 


while (...) { 
int b, © d: /* EM 2 */ 
网 1 
while (...) { 
int c, d; ez /* 证 多 3 */ 


ca ee 2 
} 
one Smile eee 3 
} 
ew SSSR EES 4 
} 


对 函数 中 的 每 一 个 标记 点 ， 请 列 出 每 个 可 见 变 量 ， 同 时 也 列 出 定义 这 个 变量 的 定义 语句 的 数目 。 
13. 考虑 下 面 的 框架 C 程 序 : 
void funl(void); /* 样机 */ 
void fun2(void); /* 样机 */ 
void fun3(void); /* 样机 */ 
void main() { 
int a, b, C? 


} 


void funl(void) { 
int D; Cp ds 


} 


void fun2(void) { 
int c, d, e; 


} 
void fun3(void) { 
int d, e; f; 


} 


给 定 下 面 的 调用 序列 ， 并 假设 使 用 的 是 动态 作用 域 ， 在 最 后 一 个 被 调用 的 函数 的 执行 期 间 ， 哪 些 变量 
是 可 见 的 ? 对 于 每 一 个 可 见 变 量 ， 请 给 出 定义 这 些 变量 的 函数 的 名 称 。 
a. main 调 用 funl; funl 调 用 fun2; fun2 调 用 fun3，。 
b. main 调 用 funl; funl 调 用 fun3。 
c. main 调 用 fun2; fun2 调 用 fun3; fun3 调 用 fun1，。 
d. main 调 用 fun3; fun3 调 用 fun1。 
e.main 调 用 fun1; funl 调 用 fun3; fun3 调 用 fun2 。 
f. main 调 用 fun3 ，fun3 调 用 fun2 ，fun2 调 用 funl 。 
14. 考虑 下 面 的 程序 : 


BF MR RMA RMR TS 


procedure Main is 
X, Y, Z : Integer; 
procedure Subl is 
A, Yr Z : Integer; 
begin -- Subl 开 始 


end; -- Subl 结 束 
procedure Sub2 is 

A, B, Z : Integer; 

begin -- Sub2 开 始 


end; -- Sub2 结 束 
procedure Sub3 is 
A, X, W : Integer; 


begin -- Sub3 开 始 

end; -- Sub3 结 束 
begin -- Main 开 始 
end; -- Main 结 束 


给 定 下 面 的 调用 序列 ， 并 假设 使 用 的 是 动态 作用 域 ， 在 执行 最 后 一 个 活跃 子 程序 期 间 ， 哪 些 变量 是 可 
见 的 ?对 于 每 个 可 见 变量 ， 请 给 出 声明 这 些 变量 的 程序 单元 的 名 称 。 

a. main 调 用 subl; subl 调 用 sub2; sub2 调 用 sub3， 

b.main 调 用 subl; subl 调 用 sub3。 

c.main 调 用 sub2; sub2 调 用 sub3; sub3 调 用 sub1。 

d. main 调 用 sub3; sub3 调 用 subl， 

e. main 调 用 subl; subl 调 用 sub3; sub3 调 用 sub2。 

f. main 调 用 sub3; sub3 调 用 sub2; sub2 调 用 sub1l， 


程序 设计 练习 题 


:Perl 语言 匈 许 静态 作用 域 以 及 一 种 动态 作用 域 。 编 写 一 个 使 用 这 两 种 作用 域 的 Perl 程 序 ， 并 清晰 地 显示 
这 丙种 作用 域 在 效果 上 的 不 同 。 清 楚 地 解释 本 章 所 描述 的 动态 作用 域 与 Perl 语 言 中 所 实现 的 动态 作用 域 
之 间 的 不 同 。 


Dt 


2. 编写 一 个 COMMON LISP 程 序 ， 它 能 够 清楚 地 显示 静态 作用 域 与 动态 作用 域 之 间 的 区 别 。 
3. 编写 一 个 具有 三 层 幅 套子 程序 的 JavaScript 脚 本 ， 其 中 每 一 个 子 程序 可 以 引用 所 有 在 包含 这 个 子 程序 本 
身 的 子 程序 中 定义 的 变量 。 
4. 编写 一 个 C 函 数 ， 它 包含 了 下 列 语句 系列 : 
x = 21; 
int x; 
x = 42; 


运行 这 个 程序 并 解释 其 结果 。 再 用 C++ 和 Java 重 新 编写 同样 的 程序 ， 并 比较 它们 的 结果 。 

5 用 C++、Java 以 及 C# 编 写 测试 程序 ， 来 确定 在 一 条 fo 语句 中 声明 的 变量 的 作用 域 。 尤 其 是 所 编写 的 代 
码 必 须 能 够 确定 这 样 的 变量 在 for 语 句 的 循环 体 之 后 是 否 可 见 。 

6. 用 C++ 或 者 C 编 写 三 个 函数 ， 第 一 个 静态 地 声明 一 个 大 数组 ， 第 二 个 在 栈 上 声明 同样 的 一 个 数组 ， 第 三 
个 则 从 堆 中 建立 同样 的 数组 。 每 个 函数 至 少 被 调用 100 000 次 ， 记 录 下 它们 各 自 所 需要 的 运行 时 间 。 解 
释 你 的 结果 。 

7. 选择 一 种 语言 编写 程序 ， 使 该 语言 在 使 用 名 字 等 价 和 结构 等 价 时 呈现 不 同 的 行为 。 

8. 在 C++ 中 而 不 是 在 Java 中 ， 哪 种 类 型 的 A 和 B 是 合法 的 简单 赋值 语句 A=B? 

9. 在 Java 中 而 不 是 在 Ada 中 ， 哪 种 类 型 的 A 和 B 是 合法 的 简单 赋值 语句 A=B? 
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第 6 章 数据 类 型 


这 一 章 首先 将 介绍 数据 类 型 的 概念 ， 以 及 常用 基本 数据 类 型 的 特征 ， 然 后 讨论 枚 举 和 子 范 
围 类 型 的 设计 ， 接 着 将 学 习 结构 化 数据 类 型 ， 特 别 是 数组 、 记 录 和 联合 ， 最 后 对 指针 和 引用 进 
行 深入 的 学 习 。 

我 们 将 曾 述 每 一 种 数据 类 型 的 设计 问题 ， 并 且 将 解释 在 一 些 重要 语言 的 设计 中 设计 人 员 所 
做 出 的 选择 ， 并 对 这 些 设计 做 出 评估 。 

数据 类 型 的 实现 方法 有 时 极 大 地 影响 着 它们 的 设计 ， 因 此 各 种 数据 类 型 的 实现 问题 ， 尤 其 
是 数组 的 实现 问题 ， 是 本 章 的 另 一 个 重要 部 分 。 


6.1 概述 


数据 类 型 定义 一 组 数据 值 ， 以 及 在 这 些 数值 上 预定 义 的 一 组 操作 。 计 算 机 程序 通过 操纵 数 
据 来 产生 结 采 。 决 定 计算 机 程序 执行 任务 难 易 程度 的 一 个 重要 因素 ， 是 可 提供 的 正在 使 用 的 数 
据 类 型 与 真实 世界 问题 空间 的 匹配 程度 。 因 此 ， 一 种 语言 能 够 支持 适当 多 样 化 的 数据 类 型 与 结 
构 就 成 为 关键 。 

数据 类 型 化 的 现代 概念 是 从 过 去 50 年 间 发 展 起 来 的 。 在 最 早期 的 语言 中 ， 必 须 用 语言 来 支 
持 少 量 基 本 数据 结构 ， 以 模拟 所 有 问题 空间 的 数据 结构 。 例 如 在 Fortran 90 之 前 ， 通 常 使 用 数组 
来 模拟 链表 及 二 又 树 结构 。 

COBOL 的 数据 结构 通过 允许 程序 人 员 指 明 小 数 的 精度 ， 并 通过 给 信息 记录 提供 一 种 结构 化 
的 数据 类 型 ， 跨 出 了 脱离 Fortran I 模式 的 第 一 步 。PL/I 语 言 更 是 将 精度 说 明 的 功能 扩展 到 整数 与 
浮 点 类 型 。 这 种 功能 从 此 被 引进 了 Ada 和 Fortran 语 言 中 。PL/I 的 设计 人 员 包 括 了 多 种 数据 类 型 ， 
目的 在 于 让 语言 能 够 支持 较 大 范围 的 应 用 。ALGOL 68 则 引入 了 一 种 更 好 的 方式 ， 就 是 仅 提 供 
少数 的 基本 类 型 以 及 少量 灵活 的 结构 定义 操作 符 ， 而 允许 程序 人 员 为 每 一 种 需求 设计 一 种 数据 
结构 。 显 然 ， 这 是 数据 类 型 设计 的 发 展 进程 中 最 重要 的 进步 之 一 。 用 户 定义 的 类 型 通过 使 用 具 
有 意义 的 类 型 名 字 增 进 了 可 读 性 。 它 们 允许 对 特殊 用 途 的 变量 进行 类 型 检测 ， 这 在 过 去 是 不 可 
能 的 。 用 户 定义 的 类 型 也 有 助 于 可 修改 性 : 程序 人 员 只 需要 改变 类 型 声明 语句 ， 就 能 够 改变 程 
序 中 一 类 变量 的 类 型 。 

从 用 户 定 义 类 型 这 个 概念 往 前 一 步 ， 我 们 就 到 达 了 抽象 数据 类 型 的 阶段 ， 这 种 抽象 数据 类 
型 能 够 在 Ada 83 中 进行 模拟 ， 并且 它 是 大 部 分 后 续 语言 的 组 成 部 分 。 抽 象 数 据 类 型 的 基本 思想 
是， 类 型 的 接口 〈 它 对 用 户 可 见 ) 与 类 型 的 表示 和 在 类 型 的 值 上 的 操作 集 相 分 离 ( 它 对 用 户 不 
可 见 )。 高 级 程序 设计 语言 提供 的 所 有 类 型 都 是 抽象 数据 类 型 。 关 于 用 户 定义 的 抽象 数据 类 型 ， 
将 在 第 11 章 中 进行 详细 讨论 。 

尽管 关联 数组 变 得 流行 起 来 ， 但 两 种 最 常用 的 结构 化 ( 非 标量 的 ) 数据 类 型 是 数组 和 记录 。 
这 丙种 数据 类 型 以 及 少数 的 一 些 其 他 数据 类 型 由 类 型 操作 符 (或 构造 器 ) 来 指明 。 类 型 操作 符 
饺 用 来 形成 类 型 表达 式 。 例 如 ，C 语言 中 的 类 型 操作 符 是 方 括号 、 圆 括号 及 星 号 ， 它 们 分 别 用 
来 指明 数组 、 函 数 以 及 指针 。 

使 用 揪 述 符 来 描述 变量 ， 无 论 是 从 逻辑 角度 还 是 从 实际 角度 都 是 很 方便 的 。 描 述 符 是 一 个 
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性 都 是 静态 的 ， 那 么 只 有 在 编译 时 才 需 要 描述 符 。 它 们 通常 是 由 编译 器 构造 的 ， 是 符号 表 的 一 
部 分 ， 并 且 用 于 编译 期 间 。 然 而 对 于 动态 属性 ， 部 分 或 者 全 部 的 描述 符 则 必须 在 执行 期 间 维护 。 
在 这 种 情况 下 ， 描 述 符 被 运行 时 系统 使 用 。 在 所 有 的 情况 下 ， 描 述 符 都 被 用 于 类 型 检测 以 及 建 
造 分 配 与 解除 分 配 操作 的 代码 。 

ATR (object) 一 词 常常 与 一 个 变量 的 值 以 及 这 个 变量 所 占 的 空间 相关 联 。 然 而 在 本 书 中 ， 
我 们 特别 保留 对 象 这 一 词 ， 仅 将 它 用 于 用 户 定义 的 抽象 数据 类 型 的 实例 ， 而 不 再 将 它 用 于 预定 
义 类 型 的 变量 值 。 在 面向 对 象 的 语言 中 ， 每 一 个 类 中 的 每 一 个 实例 ， 不 论 它 是 预定 义 的 还 用 户 
定义 的 ， 都 被 称 为 对 象 。 关 于 对 象 ， 我 们 将 在 第 11 章 和 第 12 章 中 详细 讨论 。 

在 下 面 的 几 节 里 ， 我 们 将 讨论 所 有 常用 的 数据 类 型 。 还 将 对 其 中 的 大 部 分 数据 类 型 说 明 类 
型 设计 中 的 特殊 问题 。 我 们 将 对 所 有 的 数据 类 型 都 给 出 一 个 或 多 个 设计 范例 的 描述 。 有 一 个 设 
计 问 题 是 所 有 数据 类 型 中 最 基本 的 问题 : 即 ， 对 于 这 种 类 型 的 变量 提供 了 什么 样 的 操作 ， 以 及 
怎样 说 明 这 些 操作 ? 


6.2 基本 数据 类 型 


不 用 其 他 类 型 来 定义 的 数据 类 型 被 称 为 基本 数据 类 型 。 几 乎 所 有 程序 设计 语言 都 提供 一 组 
基本 数据 类 型 。 某 些 基 本 类 型 仅仅 是 硬件 的 反映 ， 例 如 整数 类 型 。 而 另 一 些 基本 类 型 只 是 在 实 
现 上 需要 一 点 非 硬件 的 支持 。 

语言 的 基本 数据 类 型 连同 一 个 或 多 个 类 型 构造 器 被 用 来 提供 结构 化 类 型 。 


6.2.1 数值 类 型 


许多 早期 的 程序 设计 语言 仅仅 具有 数值 基本 类 型 。 数 值 类 型 在 现代 语言 所 支持 的 类 型 中 仍 
然 扮 演 着 重要 角色 。 

6.2.1.1 整数 

取 第 用 的 基本 数值 数据 类 型 是 整数 。 现 在 许多 计算 机 都 支持 几 种 不 同 大 小 的 整数 。 整 数 的 
大 小 及 其 他 功能 在 一 些 程序 设计 语言 中 得 到 支持 。 例 如 ，Java 支 持 四 种 有 符号 的 整数 类 型 ， 
byte, short, int 以 及 long。 一 些 语言 ， 例 如 C++ 和 C#， 包 括 了 无 符号 的 整数 类 型 ， 它 们 只 
不 过 是 不 有 具 正 负 号 的 整数 值 类 型 ， 通 常用 于 二 进 制 数据 中 。 

在 计算 机 中 ， 有 符号 的 整数 值 由 位 串 来 表示 ， 最 左边 的 位 通常 用 来 表示 正 负 符 号 。 整 数 类 
型 由 硬件 直接 支持 。 一 个 硬件 不 直接 支持 的 整 型 例子 是 Python 的 长 整 型 。 该 类 型 的 值 的 长 度 没 
有 限制 。 长 整 型 值 能 指定 为 字面 量 ， 正 如 
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对 于 产生 值 太 大 以 致 于 不 能 用 int 类 型 表示 的 整数 算术 操作 可 以 使 用 长 整 型 值 来 存储 。 

可 以 用 符号 -数值 (sign-magnitude) 记 法 来 存储 一 个 负 整 数 ， 其 中 的 符号 位 用 来 指示 负数 ， 
剩余 的 位 用 来 表示 这 个 数 的 绝对 值 。 然 而 ， 符 号 数值 记 法 本 身 并 不 介入 计算 机 的 算术 运算 。 现 
在 大 多 数 的 计算 机 使 用 一 种 被 称 为 二 进 制 补 码 的 记 法 来 存储 负 整 数 ， 它 对 于 加 法 和 减法 都 极为 
方便 。 在 二 进 制 补 码 记 法 中 ， 负 整数 的 表示 是 通过 取 正 整数 的 逻辑 反 再 加 “1” 构 成 的 。 但 有 些 
计算 机 仍然 使 用 二 进 制 反 码 记 法 。 在 二 进 制 反 码 记 法 中 ， 负 整数 被 存储 为 其 绝对 值 的 逻辑 补 码 ， 
二 进 制 反 码 记 法 的 缺点 是 ， 它 具有 零 的 两 种 表示 方式 。 关 于 整数 表示 的 细节 ， 可 以 查阅 任何 汇 
编 语言 程序 设计 的 有 关 书 籍 。 
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6.2.1.2 JAX 

浮 点 数据 类 型 模拟 实数 。 但 对 于 大 多 数 实数 而 言 ， 浮 点 数 的 表达 只 是 一 种 近似 。 例 如 ， 基 
本 数 z 或 e (自然 对 数 的 底 ) 都 不 能 用 浮 点 数 记 法 准确 地 表示 。 当 然 ， 这 两 个 数 都 不 能 在 任何 有 
限 的 空间 内 被 精确 地 表示 出 来 。 在 大 多 数 计算 机 上 ， 浮 点 数 被 存储 为 二 进 制 数 ， 这 使 得 问题 更 
加 糟糕 。 例 如 ， 甚 至 连 十 进 制 数 的 0.1 都 不 能 够 用 有 限 的 二 进 制 数 来 表示 。 浮 点 类 型 的 另 一 个 
问题 是 在 算术 运算 之 后 会 丢失 准确 性 。 有 关 浮 点 数 记 法 问题 的 更 多 信息 ， 请 参考 任何 有 关 数 值 
分 析 的 书籍 。 

浮 点 值 被 表示 为 小 数 和 指数 ， 这 是 借鉴 科学 标记 法 的 一 种 形式 。 早 期 的 计算 机 使 用 了 多 种 
不 同 的 浮 点 值 表示 方式 。 然 而 ， 最 新 的 机 器 则 使 用 IEEE 浮 点 标准 754 的 格式 。 语 言 的 实现 人 员 
采用 硬件 支持 的 表示 形式 。 大 多 数 的 语言 通常 包括 了 被 称 为 float (FAR) 和 double ( 双 
精度 浮 点 数 ) 的 两 种 浮 点 类 型 。f1Loat 类 型 具有 标准 的 大 小 ， 通 常 被 存储 于 四 个 字 节 之 中 。 
double 类 型 专门 用 于 需要 较 长 小 数 部 分 的 情形 。 双 精度 变量 通常 占用 两 倍 于 浮 点 数 变 量 所 占 
有 的 存储 空间 ， 并 且 提 供 至 少 两 倍 于 浮 点 数 变量 的 小 数位 。 

精度 与 范围 定义 了 能 够 被 浮 点 类 型 表示 的 值 的 集合 。 精 度 是 一 个 值 的 小 数 部 分 的 准确 性 ， 
它 以 位 的 数目 来 衡量 。 范 围 则 是 小 数 范围 和 指数 范围 的 组 合 ， 在 这 里 ， 指 数 范围 更 为 重要 。 

图 6-1 显 示 IEEE 浮 点 标准 754 中 单 精度 表示 和 双 精 度 表 示 的 格式 (IEEE，1985) 。 关 于 IEEE 
格式 的 细节 可 从 (Tanenbaum, 2005) 中 读 到 。 


8 位 23 位 
(aa 
人 符号 位 
a) 单 精度 
11 位 52 位 
人 符号 位 
b) 双 精度 
图 6-1 IEEE 浮 点 格式 
6.2.1.3 复数 


一 些 程序 设计 语言 支持 复数 数据 类 型 ， 例 如 ，Fortran 和 Python。 复 数值 用 浮 点 值 的 有 序 对 
来 表示 。 在 Python 中 ， 复 数字 面 量 的 虚数 部 分 用 后 接 j 或 J 来 指定 ， 例 如 ， 

7 二 ) 

支持 复数 类 型 的 语言 包含 了 在 复数 值 上 的 算术 操作 。 

6.2.1.4 小数 

大 多 数 为 支持 商务 系统 应 用 设计 的 较 大 型 计算 机 具有 支持 小 数 数据 类 型 的 硬件 。 小 数 数据 
类 型 存储 固定 数目 的 小 数位 ， 而 小 数 点 处 于 数值 中 的 一 个 固定 位 置 上 。 这 些 类 型 是 商务 数据 处 
理 中 的 主要 数据 类 型 ， 并 因此 成 为 COBOL 语 言 中 的 关键 成 分 。C# 也 具有 一 种 小 数 数据 类 型 。 

小 数 类 型 具有 的 优点 是 ， 它 至 少 能 够 在 有 限 范围 以 内 精确 存储 小 数 数值 。 而 浮 点 类 型 却 不 
能 够 做 到 。 例 如 ， 数 字 0.1 (十 进 制 ) 在 十 进 制 中 能 够 精确 表示 ， 但 是 在 浮 点 类 型 中 却 不 能 ， 正 


和 十进制 的 0.1 等 于 二 进 制 的 0.0001100110011…。 
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如 在 6.2.1.2 节 中 我 们 所 看 到 的 。 小 数 类 型 的 缺点 是 ， 因 为 不 允许 有 指数 ， 小 数 数值 的 范围 受 
BR; 并 且 它 们 在 存储 器 中 的 表示 十 分 浪费 。 

小 数 类 型 的 存储 与 字符 串 的 存储 非常 类 似 ， 都 是 使 用 二 进 制 码 来 表示 十 进 制 数字 。 这 样 的 
表示 方式 被 称 为 二 进 制 编码 的 十 进 制 数 (binary coded decimal，BCD)。 在 某 些 情况 下 ， 每 一 个 
数字 被 存储 于 一 个 字 节 中 ， 而 在 另 一 些 情况 下 ， 每 两 个 数字 被 放 进 一 个 字 节 。 无 论 哪 一 种 方式 ， 
它们 都 比 二 进 制 表示 占据 的 存储 空间 更 多 。 它们 至 少 需 要 4 个 位 进行 一 个 十 进 制 数字 编码 。 因 此 ， 
存储 一 个 6 位 数字 的 十 进 制 数 就 需要 24 个 位 的 存储 空间 。 而 在 二 进 制 中 存储 相同 的 数 只 需要 20 个 
位 。9 小 数 数值 上 的 操作 是 在 具有 这 种 功能 的 机 器 的 硬件 上 进行 的 ， 不 然 的 话 就 使 用 软件 来 模 
拟 这 些 操作 。 


6.2.2 布尔 类 型 


布尔 类 型 也 许 是 所 有 类 型 中 最 简单 的 类 型 。 这 种 类 型 值 的 范围 只 有 两 个 元 素 ， 一 个 为 真 ， 
一 个 为 假 。 布 尔 类 型 由 ALGOL 605| 入 ， 并 被 引进 大 部 分 20 世 纪 60 年 代 以 后 设计 的 通用 语言 中 。 
有 一 个 例外 则 是 广 为 流 行 的 C89 语 言 ， 在 这 种 语言 中 能 够 使 用 数值 表达 式 作 为 条 件 。 在 这 样 的 
表达 式 中 ， 所 有 非 零 值 的 操作 数 都 被 认为 是 真 ， 而 具有 和 零 值 的 操作 数 则 被 认为 是 假 。 虽 然 C 99 
以 及 C++ 语言 具有 布尔 类 型 ， 但 它们 还 是 允许 使 用 数值 表达 式 代 替 布尔 类 型 的 使 用 。 但 这 在 
Java 和 C# 中 是 不 允许 的 。 

在 程序 中 ， 布 尔 类 型 常 被 用 来 表示 转换 (switch) 或 标志 (flag)。 尽 管 其 他 类 型 ， 如 整数 ， 
也 可 以 用 作 同 样 的 目的 ， 但 使 用 布尔 类 型 能 够 获得 更 好 的 可 读 性 。 

可 以 由 单个 位 来 表示 布尔 值 ， 但 因为 在 许多 机 妖 上 难以 有 效 地 存 取 存 储 器 中 的 单个 位 ， 所 
以 第 常 将 布尔 值 储存 于 存储 右 中 最 小 但 能 够 高 效 寻 址 的 单位 中 ， 是 在 一 个 字 市 中 。 


6.2.3 字符 类 型 


字符 数据 是 以 数值 编码 的 形式 存储 于 计算 机 中 。 最 普遍 使 用 的 数值 编码 是 8 位 的 ASCII 码 
(American Standard Code for Information Interchange) ， 这 种 编码 使 用 0 127 的 数值 来 对 128 个 不 
同 字符 进行 编码 。ISO 8859-1 是 另 一 种 8 位 字符 编码 ， 但 它 人 允许 256 个 不 同 的 字符 。Ada 95 使 用 
ISO 8859-145, 

因为 商务 的 全 球 化 ， 以 及 计算 机 间 全 球 性 交流 的 需要 ，ASCI 的 字符 集 很 快 就 不 够 用 了 。 
人 们 因而 开发 了 一 种 称 为 Unicode 码 的 16 位 字符 集 。Unicode 包 括 了 世界 上 大 多 数 自然 语言 中 的 
字符 。 例 如 ，Unicode 包 括 了 用 于 塞尔维亚 语 的 Cyrillic 字 母 ， 以 及 泰国 人 使 用 的 数字 。Unicode 
中 的 前 128 个 字符 与 ASCII 码 中 相同 。Java 是 第 一 种 使 用 Unicode 字 符 集 的 广泛 应 用 的 语言 。 此 后 ， 
Unicode 也 被 用 于 JavaScript、Python、Perl 以 及 C# 中 。 

为 了 提供 处 理 单 个 字符 代码 的 方法 ， 许 多 程序 设计 语言 都 包括 了 字符 基本 类 型 。 然 而 ， 
Python 支 持 单字 符 ， 并 把 该 字符 作为 长 度 为 1 的 字符 串 。 


6.3 字符 串 类 型 


字符 串 类 型 是 这 样 一 种 类 型 : 这 种 类 型 的 值 由 字符 序列 组 成 。 字 符 串 常量 用 来 标记 输出 ， 
因为 各 种 数据 的 输入 与 输出 常常 是 以 字符 串 的 形式 来 完成 的 。 当 然 ， 字 符 串 也 是 所 有 进行 字符 
处 理 程序 中 的 一 个 基本 类 型 。 


O ”当然 ， 除 非 程序 需要 维护 大 量 的 六 十 进 制 值 ， 不 然 区 别 是 很 微小 的 。 
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6.3.1 设计 问题 


字符 串 类 型 所 特有 的 两 个 最 重要 的 设计 问题 是 ， 
* 字符 串 应 该 仅仅 是 一 种 特殊 种 类 的 字符 数组 ， 还 是 一 种 基本 类 型 ? 
. 字符 串 应 该 具有 静态 长 度 还 是 动态 长 度 ? 


6.3.2 字符 串 及 其 操作 


一 般 的 字符 串 操作 包括 赋值 、 连 接 、 子 字符 串 引 用 、 比 较 和 模式 匹配 。 

子 串 引用 是 对 给 定 字符 串 中 的 一 个 子 串 的 引用 。 子 串 引 用 将 在 学 习 数组 时 再 进行 讨论 。 数 
组 中 的 子 串 引用 称 为 片 (slice)。 

通常 情况 下 ， 因 为 具有 不 同 长 度 操 作 数 赋值 和 比较 的 可 能 ， 因 此 字符 串 的 赋值 和 比较 操作 
是 复杂 的 。 例 如 ， 当 把 一 个 长 字符 串 赋 给 一 个 短 字符 串 时 将 发 生 什 么 ， 反 之 ， 又 会 怎么 样 ? 通 
前 ， 根 据 实 际 情况 作出 相应 简单 合理 的 选择 ， 尽 管用 户 很 难 记 住 它们 。 

模式 匹配 是 另 一 种 基本 的 字符 字符 串 操 作 。 在 一 些 语言 中 ， 模 式 匹 配 直接 受到 支持 ,在 另 
一 些 语 言 中 ， 它 通过 函数 或 类 库 得 到 支持 。 

如 朱 不 将 字符 串 定 义 为 基本 类 型 ， 字 符 串 数据 则 通常 会 被 储存 于 字符 数组 中 ， 并 会 像 数 组 
数据 一 样 被 引用 。 这 是 C 以 及 C++ 采用 的 方法 。 

C 和 C++ 使 用 chaz 数 组 来 存储 字符 串 ， 并 由 一 个 头 文件 为 string.h 的 标准 程序 库 来 提供 
一 组 字符 串 操作 。 大 多 数字 符 串 的 使 用 以 及 大 部 分 程序 库 函 数 都 遵循 由 特殊 字符 nul1 终 止 字符 
串 的 协定 ，nu11 用 零 值 表示 。 这 是 保持 字符 串 变 量 长 度 的 一 种 替代 方法 。 当 程 序 库 的 操作 作用 
于 一 个 串 时 ， 它 将 一 直 进行 到 nul11 字 符 出现 为 止 。 构 造 串 的 库 函 数 常常 提供 了 这 种 nul1 字 符 . 
由 编译 袁 构 造 的 字符 串 常 量 也 具有 nu11 字 符 。 例 如 下 面 的 声明 ， 

char str[] = "apples"; 

在 这 个 例子 中 ，str 是 一 个 char 指 针 ， 被 设置 用 来 指向 字符 串 apples0， 这 里 的 0 就 是 
null 字 符 。 

在 C 和 C++ 中 ， 用 于 字符 串 的 最 常用 库 函 数 有 strcpy， 它 被 用 来 进行 串 的 复制 ，strcat， 
它 的 作用 是 将 给 定 的 串 连 接 到 另 一 个 串 上 ，strcmp， 它 的 作用 是 按 字符 来 比较 两 个 给 定 的 串 
(按照 字符 编码 的 次 序 )，strlen， 它 返回 给 定 串 中 的 字符 数目 ， 但 不 包括 null 字 符 。 大 多 数 
捉 处 理 函 数 的 参数 及 返回 值 是 一 些 指向 char 数 组 的 char 指 针 。 参数 也 可 以 是 字符 串 字面 常量 。 

C 标 准 库 中 的 串 操 作 函 数 在 C++ 语言 中 也 可 以 使 用 ， 但 它们 本 身 是 不 安全 的 ， 并 已 经 造成 了 
无 数 的 安全 问题 。 这 是 由 于 这 种 移动 串 数据 的 库 函 数 不 管制 溢出 范围 的 问题 。 例 如 ， XEFE eI 
数 strcpy 的 调用 : 

strcpy(src, dest); 

如 霖 dest 的 长 度 为 20， 而 src 的 长 度 为 50。strcpy 将 会 覆盖 dest 后 面 30 个 字符 (通常 在 
运行 时 栈 ) 的 区 域 ， 而 这 个 区 域 通常 是 在 运行 栈 中 。 这 里 的 问题 是 strcpy 不 知道 dest 的 长 度 ， 
因而 不 能 够 保证 它 不 会 覆盖 dest 后 面 的 存储 空间 。C 库 中 的 几 个 其 他 字符 捉 国 数 也 存在 同样 的 
问题 。 包 括 C 风 格 字符 串 ，C++ 也 通过 与 Java 相 似 的 标准 类 库 来 支持 字符 串 。 因为 C 字 符 串 库 的 
不 安全 性 ，C++ 的 程序 人 员 应 该 使 用 标准 库 中 的 string 类 ， 而 不 古 使 用 char 数 组 以 及 C 中 的 
字符 串 库 。 

Fortran 95 将 串 作 为 基本 类 型 来 处 理 ， 并 且 还 提供 了 赋值 、 关 系 操作 符 、 连 接 以 及 子 串 引 用 
操作 。 
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在 Java 中 通过 String 类 和 StringBuffer 类 ，Java 支 持 字符 串 为 基本 类 型 ，String 类 的 
值 为 营 量 字符 串 ， 而 StzringBuffez 的 值 是 可 变 的 ， 并 且 较 类 似 于 字符 数组 。StringBuffer 
类 中 的 变量 允许 具有 下 标 。C# 和 Ruby 中 的 字符 串 类 十 分 类 似 于 Java 中 的 字符 串 类 。 

Python 也 把 字符 串 作 为 基本 类 型 ， 并 且 有 子 字 符 串 引用 、 连 接 、 索 引 访问 单个 字符 串 以 及 
查找 和 替代 方法 等 操作 。 字 符 串 也 有 字符 成 员 操 作 。 因 此 ， 尽 管 Python 字 符 串 是 基本 类 型 ， 但 
是 它们 执行 的 字符 和 子 字符 串 引用 更 像 是 字符 数组 。 然 而 ，Python 字 符 串 是 不 可 变 的 ， 这 与 
Java 的 stzing 类 对 象 很 相似 。 

Perl、JavaScript、Ruby 以 及 PHP 中 包括 了 内 置 的 模式 匹 
配 操作 。 在 这 些 语 言 中 ， 模 式 匹配 表达 式 都 或 多 或 少 地 基 GER ee eG 
于 数学 的 正则 表达 式 。 事 实 上 ， 常 常 就 称 它们 为 正则 表达 os ee mene, 
式 。 它 们 从 早期 UNIX 行 编辑 器 ed 演变 成 为 UNIX shell 语 言 
的 一 部 分 ， 最 终 变 成 了 目前 所 具有 的 复杂 形式 。 如 果 要 解释 模式 匹配 表达 式 ， 至 少 需 要 完整 的 
一 本 书 (Friedl，1997)。 本 节 只 是 想 通 过 两 个 相对 简单 的 例子 来 提供 关于 这 些 表达 式 风格 的 一 
个 概貌 。 

考虑 下 面 的 模式 表达 式 ， 


/[A-Za-z][A-Za-z\d]+/ 


这 种 模式 匹配 了 (或 描述 了 ) 程序 设计 语言 中 的 典型 名 字形 式 。 方 括号 包括 的 是 字符 类 ， 
第 一 字符 类 说 明了 所 有 字母 ， 第 二 类 则 说 明了 所 有 的 字母 以 及 数字 (数字 使 用 缩写 \d 来 说 明 )。 
如 霖 仅仅 是 说 明了 第 二 类 ， 我 们 不 能 阻止 名 字 从 数字 开始 。 紧 跟 第 二 个 类 的 加 号 操作 符 说 明 必 
定 存 在 一 个 或 多 个 这 种 类 的 范例 。 这 样 ， 与 整个 模式 相 匹配 的 字符 串 开始 于 一 个 字母 ， 后 面 跟 
随 一 个 或 者 多 个 字母 或 数字 。 

下 面 再 考虑 男 一 个 模式 表达 式 : 

/\d+\.?\d*|\.\d+/ 

这 个 模式 匹配 数值 字面 常量 。 这 里 的 ^.” 说 明 一 个 字面 常量 的 小 数 点 。 “问号 说 明 它 所 跟 
随 的 事物 出 现 零 次 或 一 次 。 垂 直线 “Il” 分 开 这 个 模式 的 两 种 可 能 选择 。 第 一 种 选择 匹配 的 串 是 
一 个 或 者 多 个 数字 ， 可 能 跟随 着 一 个 小 数 点 ， 再 跟随 零 个 或 者 多 个 数字 ;第 二 种 选择 匹配 的 串 
开始 于 一 个 小 数 点 ， 小 数 点 之 后 跟随 一 个 或 者 多 个 数字 。 

C++、jJava、Python 和 C# 的 类 库 包 括 了 模式 匹配 的 功能 。 


6.3.3 串 长 度 选择 


关于 字符 串 值 的 长 度 有 几 种 设计 选择 。 第 一 种 选择 是 这 种 长 度 可 以 为 静态 的 ， 并 可 以 在 声 
明 语句 里 进行 说 明 。 我 们 称 这 样 的 串 为 静态 长 度 串 。 这 正 是 一 种 设计 选择 ， 如 Python 的 字符 串 、 
Java 的 Stzing 类 中 的 不 可 变 对 象 、C++ 标 准 类 库 中 类 似 的 类 、Ruby 的 内 建 sStzing 类 ， 以 及 可 
用 于 C# 的 .NET 类 库 。 

第 二 种 选择 是 允许 串 具 有 可 变 长 度 ， 且 将 其 上 限 固 定 为 由 变量 定义 所 设 定 的 最 大 值 。 这 样 
的 例子 有 C 以 及 C++ 中 C 风 格 的 串 。 这 种 串 被 称 为 有 限 动态 长 度 串 。 这 种 串 变量 能 够 存储 零 与 最 
太 值 之 间 任意 数目 的 字符 。 回 忆 C 语 言 中 的 串 ， 它 们 使 用 一 个 特别 的 字符 来 作为 串 里 字符 的 结 
尾 ， 而 不 是 保持 串 的 长 度 。 


O 句 氮 前 必须 加 反 斜 线 ， 主 要 是 因为 在 正则 表达 式 中 句点 有 特殊 的 含义 。 
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第 三 种 选择 是 允许 串 具 有 可 变 的 长 度 ， 而 并 不 限制 长 度 的 最 大 值 ， 如 JavaScript 和 Perl 中 的 
情形 。 这 种 类 型 的 串 被 称 为 动态 长 度 串 。 这 种 选择 具有 动态 存储 空间 分 配 以 及 动态 解除 分 配 的 
额外 代价 ， 但 能 够 提供 最 大 限度 的 灵活 性 。 

Ada 95 支 持 所 有 的 这 三 种 选择 。Standard 包 中 的 Stzing 类 型 提供 静态 长 度 串 ，Rda . 
Strings.Bounded 包 中 的 Bounded _String 类 型 支持 有 限 动 态 长 度 串 ， 而 Ada .Strings 。 
Unbounded 包 中 的 Unbounded _ String 类 型 则 支持 动态 长 度 串 。 


6.3.4 评估 


串 类 型 对 一 种 语言 的 可 写 性 十 分 重要 。 把 串 作 为 数组 来 处 理 ， 可 能 比 将 它 作为 基本 类 型 来 
处 理 更 为 麻烦 。 把 串 作为 一 种 基本 类 型 加 到 语言 中 ， 就 语言 或 者 编译 器 的 复杂 性 而 言 ， 所 增加 
的 代价 并 不 高 。 因 而 ， 人 们 很 难为 一 些 当 代 语 言 省 略 基本 串 类 型 来 进行 辩护 。 当 然 ， 实 施 串 处 
理 的 标准 库 可 以 弥补 没有 将 串 包 括 进 基本 类 型 的 缺陷 。 

字符 串 操 作 ， 例 如 简单 的 模式 匹配 及 连接 ， 是 非常 必要 的 ， 应 该 将 它 包 括 进 来 ， 以 便 对 串 
类 型 的 值 进行 操作 。 尽 管 动态 长 度 串 显然 最 灵活 ， 但 是 必须 在 实现 时 所 需 的 额外 开销 与 其 所 带 
来 的 灵活 性 之 间 进 行 权衡 。 


6.3.5 字符 串 类 型 的 实现 


字符 串 类 型 可 以 由 硬件 直接 支持 。 但 在 大 多 数 情况 下 ， 是 使 用 软件 来 实现 串 的 存储 、 检 索 
以 及 处 理 。 当 字符 串 类 型 被 表示 为 字符 数组 时 ， 这 种 语言 常常 不 提供 什么 操作 。 

只 在 编译 期 间 需要 的 静态 字符 串 类 型 ， 其 描述 符 具 有 三 个 域 。 每 一 个 描述 符 的 第 一 个 域 都 
是 类 型 的 名 字 。 在 静态 字符 串 的 情况 下 ， 第 二 个 域 是 类 型 的 长 度 (以 字符 计 )。 第 三 个 域 则 是 第 
一 个 字符 的 地 址 。 图 6-2 显 示 了 这 种 描述 符 。 有 限 动 态 串 需要 一 个 运行 时 描述 符 来 存储 固定 的 最 
大 长 度 以 及 当前 长 度 ， 如 图 6-3 所 示 。 动 态 长 度 串 则 要 求 一 个 较 简 单 的 运行 时 描述 符 ， 因 为 它 只 
需要 储存 当前 的 长 度 。 虽 然 我 们 将 描述 符 描绘 成 为 独立 的 块 ， 但 在 大 多 数 情况 下 它们 被 存放 于 
符号 表 中 。 





图 6-2 静态 字符 串 的 编译 时 描述 符 图 6-3 有 限 动 态 串 的 运行 时 描述 符 


C 以 及 C++ 中 的 有 限 动态 串 不 需要 运行 时 描述 符 ， 因 为 这 种 串 的 结尾 由 null 字 符 标 记 。 它 
们 也 不 需要 限制 最 大 长 度 ， 因 为 在 这 些 语言 中 数组 引用 不 具有 下 标 值 范围 的 检测 。 

静态 长 度 串 以 及 有 限 动态 长 度 串 不 需要 特别 的 动态 存储 分 配 。 对 于 有 限 动 态 长 度 串 ， 当 串 
变量 与 存储 空间 绑 定时 ， 就 已 经 为 最 大 长 度 分 配 了 充分 的 存储 空间 ， 因 而 只 需要 进行 一 次 分 配 
的 过 程 。 

动态 长 度 串 则 需要 较 复 杂 的 存储 管理 。 串 的 长 度 以 及 与 长 度 关联 的 串 所 绑 定 的 存储 空间 必 
须 动 态 地 变 大 和 变 小 。 

关于 动态 长 度 串 所 需 的 动态 存储 分 配 问 题 ， 有 两 种 可 能 的 解决 方式 。 第 一 种 方式 是 可 以 将 
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串 储 存 于 链表 中 ， 这 样 当 串 变 长 时 ， 就 可 以 从 堆 上 获取 所 需要 的 新 单位 。 这 种 方法 的 缺点 是 链 
表 中 的 链接 占据 了 大 量 的 存储 空间 ， 以 及 施行 串 操 作 必然 带 来 的 复杂 性 。 

第 二 种 方法 是 存储 字符 串 作 为 指向 堆 中 分 配 的 单个 子 符 的 指针 数组 。 这 种 方法 仍然 使 用 了 
额外 的 内 存 ， 但 是 字符 串 处 理 方法 比 链表 方法 更 快 。 

第 三 种 替代 方案 是 在 相 邻 的 存储 单位 中 储存 完整 的 串 。 而 当 串 变 长 时 这 各 方法 产生 的 问题 是 ， 
怎样 为 串 变量 继续 分 配 那些 与 已 经 存在 的 存储 单位 相 邻 的 存储 空间 呢 ? 常常 ， 这 样 的 存储 空间 已 
经 用 于 其 他 用 途 ， 不 能 使 用 。 新 的 替代 方式 是 在 存储 器 中 找 一 个 能 存储 完整 串 的 新 区 域 ， 并 将 旧 
的 串 中 部 分 移 到 这 个 新 的 区 域 中 。 接 下 来 ， 再 将 旧 的 存储 单位 进行 解除 分 配 。 后 面 的 这 种 方式 是 
现在 典型 的 使 用 方法 。6.9.9 节 将 讨论 处 理 可 变 大 小 存储 段 的 分 配 与 解除 分 配 的 一 般 问 题 ， 


字符 串 操作 因 需 要 追查 指针 而 变 慢 。 另 一 方面 ， 为 完整 字符 串 使 用 相 邻 内 存单 元 会 加 速 字符 串 
操作 ， 而 且 所 需 的 存储 空间 也 显著 减少 ， 但 分 配 与 解除 分 配 过 程 变 慢 。 


6.4 用 户 定 义 的 序数 类 型 


序数 类 型 是 这 样 一 种 类 型 这 种 类 型 的 可 能 值 的 范围 能 够 很 容易 地 与 一 组 正 整数 相关 联 ， 
例如 ， 在 Java 中 的 基本 序数 类 型 有 integer (整数 )、char (字符 ) 以 及 boolean (布尔 ) 类 
型 。 程 序 设计 语言 支持 两 种 用 户 定义 的 序数 类 型 : 枚 举 类 型 和 子 范围 类 型 ， 


6.4.1 枚 举 类 型 


改 举 类 型 是 这 样 一 种 类 型 : 这 种 类 型 的 所 有 可 能 值 都 是 在 类 型 定义 中 枚 举 的 命名 常量 ， 枚 
举 类 型 提供 了 定义 以 及 组 合 命名 常量 的 一 种 方式 ， 而 这 种 命名 常量 就 被 称 为 枚 举 常量 ， 下 面 C# 
语言 的 例子 是 一 种 典型 的 枚 举 类 型 的 定义 方式 : 


enum days {Mon, Tue, Wed, Thu, Fri, Sat, Sun}; - 


与 型 地 ， 枚 举 常量 被 隐 式 地 赋予 整数 值 0，1，…， 但 也 可 以 在 类 型 定义 中 被 显 式 地 赋予 侍 
何 整数 字面 值 。 

枚 举 类 型 所 特有 的 主要 设计 问题 是 : 

“ 契 否 允许 枚 举 常量 出 现在 一 种 以 上 的 类 型 定义 中 ?如 果 允 许 ， 在 程序 中 当 这 个 常量 出 现 

时 ， 如 何 对 它们 的 类 型 进行 检测 ? 

“可 以 将 枚 举 值 强制 转换 为 整数 吗 ? 

“可 以 将 任何 其 他 类 型 强制 转换 为 枚 举 类 型 吗 ? 

所 有 这 些 设计 问题 都 与 类 型 检测 有 关 。 如 果 可 以 将 一 个 枚 举 类 型 强制 转换 为 一 个 整数 类 型 ， 
我 们 对 于 其 合法 操作 范围 以 及 取 值 范围 就 几乎 没有 控制 。 如 果 可 以 将 一 个 int 类 型 的 值 强制 转 
换 为 一 个 枚 举 类 型 ， 就 可 以 将 任何 整数 值 赋予 枚 举 类 型 的 变量 ， 而 不 论 这 个 数值 是 否 表示 一 个 
枚 举 常量 。 

6.4.1.1 设计 

在 没有 枚 举 类 型 的 语言 中 ， 程 序 人 员 通 常 是 使 用 整数 值 来 模拟 枚 举 类 型 。 假 若 我 们 需要 在 
C 程 序 中 表示 颜色 ，C 没 有 一 种 枚 举 类 型 ， 我 们 可 以 使 用 0 来 表示 蓝 色 ， 使 用 1 来 表示 红色 等 。 可 
以 如 下 所 示 来 定义 这 些 值 . 


int red = 0, blue = 1; 


现在 ， 在 这 条 程序 里 我 们 就 可 以 使 用 RED 和 BLUE， 就 像 它 们 是 颜色 类 型 一 样 。 这 种 方式 所 
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带 来 的 问题 是 ， 因 为 我 们 并 没有 定义 颜色 类 型 ， 当 使 用 RED 和 BLUE 时 不 能 够 进行 类 型 检测 。 例 
如 ， 将 RED 和 BLUE 相 加 是 合法 的 操作 ， 虽 然 我 们 并 不 想 有 这 样 的 运算 。RED 和 BLUE 还 可 能 被 与 
任何 算术 操作 符 以 及 任何 类 型 的 操作 数 结合 在 一 起 ， 而 这 些 结 合 行为 极 少 有 用 。 另 外 ， 因 为 
RED 和 BLUE 实质 上 仅仅 是 变量 ， 所 以 它们 可 能 会 被 赋予 任何 整数 值 ， 从 而 葬送 掉 它 们 与 颜色 之 
间 的 关联 。 关 于 最 后 面 的 这 个 问题 ， 可 以 通过 将 RED 和 BLUE 定义 为 命名 常量 而 得 以 避免 。 

C 和 Pascal 是 首 批 拥有 枚 举 类 型 的 广泛 应 用 的 语言 。 C++ 则 包含 了 C 中 的 枚 举 类 型 。 在 C++ 中 ， 
我 们 可 以 有 

enum colors {red, blue, green, yellow, black}; 

colors myColor = blue, yourColor = red; 


类 型 colors 使 用 了 枚 举 常量 的 默认 内 部 值 ，0，1，…， 虽 然 也 可 以 对 枚 举 常量 赋予 任何 
其 他 的 整数 值 (或 者 甚至 是 任何 常量 值 的 表达 式 )。 当 将 枚 举 常量 放置 于 整数 的 上 下 文中 时 ， 枚 
举 值 就 被 强制 转换 成 为 nt 类 型 。 这 样 就 允许 将 它们 用 于 任何 数值 表达 式 中 。 例 如 ， 如 果 
myColor 的 当前 值 是 blue， 表 达 式 
myColor++ 
将 会 赋予 myColLor 以 green 值 。 
C++ 也 允许 将 枚 举 常 量 赋 给 任何 数值 类 型 的 变量 ， 虽 然 这 常常 会 是 一 个 错误 ， 但 是 在 C++ 
任何 其 他 类 型 的 值 都 不 允许 强制 转换 成 枚 举 常量 。 例 如 


myColor = 4; 

是 非法 的 。 如 果 将 这 条 赋值 语句 的 右边 显 式 地 转换 成 colors 类 型 ， 这 条 语句 就 会 是 合法 
的 。 这 种 做 法 防止 了 一 些 潜 在 错误 的 发 生 。 

C++ 中 的 枚 举 常 量 仅 能 够 出 现在 同一 引用 环境 里 的 一 种 枚 举 类 型 中 。 

在 Ada 中 的 枚 举 字 面 常 量 被 允许 出 现在 同一 引用 环境 里 的 多 个 声明 中 。 这 样 的 字面 常量 被 
称 为 重 载 字面 常量 。 解 决 重 载 问 题 的 规则 ， 即 确定 这 样 的 字面 常量 在 某 次 出 现时 的 类 型 ， 是 必 
须 能 够 从 它 所 出 现 的 上 下 文 来 确定 其 类 型 。 例 如 ， 如 果 将 一 个 重 载 字面 常量 与 一 个 枚 举 变量 进 
行 比较 ， 这 个 字面 常量 的 类 型 就 将 被 确定 为 那个 变量 的 类 型 。 在 某 些 情 况 下 ， 程 序 人 员 必 须 为 
茶 一 次 出 现 的 重 载 字面 常量 标明 一 些 类 型 说 明 。 

因为 不 能 够 将 Ada 中 的 枚 举 字面 常量 和 枚 举 变量 强制 转换 为 整数 ， 所 以 Ada 中 的 枚 举 类 型 操 
作 的 范围 以 及 枚 举 类 型 的 值 的 范围 都 是 受 限 ， 这 使 得 编译 器 能 够 检查 出 许多 程序 人 员 的 错误 。 

在 2004 年 ，Java 5.0 版 本 中 加 入 了 一 种 枚 举 类 型 。 在 Java 语 言 中 的 所 有 枚 举 类 型 都 隐 式 地 为 
预定 义 类 Enum 的 子 类 。 而 因为 枚 举 类 型 是 类 ,它们 就 可 以 具有 对 象 数据 域 、 构 造 函 数 以 及 方法 。 
在 语法 上 ，Java 中 枚 举 类 型 定义 的 表 观 十 分 类 似 于 C# 中 的 枚 举 类 型 定义 ， 除 了 Java 中 的 枚 举 类 
型 可 以 包括 域 、 构 造 函数 以 及 方法 之 外 。 一 个 枚 举 类 可 能 具有 的 值 仅仅 就 是 枚 举 类 所 有 可 能 也 
对 象 。 所 有 的 枚 举 类 型 都 继承 tostring 以 及 一 些 其 他 方法 。 使 用 静态 方法 values 可 以 获取 一 
个 枚 举 类 型 的 对 象 数 组 。 而 使 用 方法 ordinal 可 以 获得 一 个 枚 举 变 量 的 内 部 数值 的 值 。 不 可 以 
将 任何 其 他 类 型 的 表达 式 赋 给 枚 举 变量 。 而 且 ， 不 可 以 将 枚 举 变量 强制 转换 为 任何 其 他 的 类 型 

C# 中 的 枚 举 类 型 与 C++ 中 的 枚 举 类 型 很 类 似 ， 但 是 在 C# 中 不 能 够 将 枚 举 类 型 强制 转换 为 束 
数 。 因 此 ， 可 以 将 枚 举 类 型 的 操作 限制 在 具有 意义 的 那些 操作 上 ， 而 且 可 以 将 值 的 范围 限制 在 
特定 枚 举 类 型 的 值 之 中 。 

有 趣 的 是 ， 最 近 没 有 一 种 脚本 语言 包含 枚 举 类 型 ， 其 中 包括 Perl、JavaScript、PHP、 Python 
和 Ruby。 甚 至 在 枚 举 类 型 加 入 Java 以 前 ，Java 已 经 有 10 年 的 历史 了 。 
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6.4.1.2 评估 

枚 举 类 型 在 可 读 性 和 可 靠 性 两 方面 提供 了 优越 性 。 可 读 性 的 提高 是 由 于 一 种 非常 直接 的 方 
w: 即 ， 可 以 容易 地 辨认 命名 的 值 ， 但 不 容易 辨认 编码 的 值 。 

在 可 靠 性 方面 ，Ada，C# 以 及 Java 5.0 中 的 枚 举 类 型 提供 了 两 种 好 处 。 首 先 ， 没 有 任何 一 种 
算术 操作 对 枚 举 类 型 是 合法 的 ， 这 样 就 防止 如 将 一 周 中 的 星期 一 与 星期 二 相 加 的 类 似 运 算 。 其 
次 ， 不 能 够 给 枚 举 类 型 赋 以 其 定义 范围 之 外 的 任何 值 。 如 果 前 面 的 colors 枚 举 类 型 具有 10 个 
枚 举 常量 ， 并 使 用 0，…，9 作 为 它 的 内 部 值 的话 ， 那 么 就 不 可 以 将 任何 大 于 9 的 数值 赋 给 
colors 类 型 恋 量 。 

因为 C 对 待 枚 举 变量 就 像 对 待 整数 变量 一 样 ， 因 而 C 不 具有 上 面 所 述 的 这 两 种 优 后 。 

C++ 比 C 语 言 稍微 进步 ， 可 以 将 数值 赋 给 枚 举 类 型 的 变量 ,但 仅 当 可 以 将 这 些 数值 转换 成 被 
赋值 变量 的 类 型 时 。 赋 给 枚 举 类 型 变量 的 数值 将 被 检测 ， 用 以 确定 这 些 数值 是 否 在 这 种 枚 举 类 
型 的 内 部 值 范 围 之 内 。 然 而 不 幸 的 是 ， 如 果 用 户 采 用 了 一 个 很 广泛 的 值 范 围 ， 这 种 检测 就 将 非 
RHR. PAN, 


enum colors {red = 1, blue = 1000, green = 100000} 


在 这 个 例子 中 ， 任 何 一 个 赋 给 colors 类 型 变量 的 数值 都 将 被 检测 ， 只 是 为 了 确定 它 是 否 
在 1，…，100 000 的 范围 之 内 。 

Ada，C# 以 及 Java 5.0 中 的 枚 举 类 型 ， 较 之 C++ 中 的 枚 举 类 型 优越 得 多 ， 因 为 这 些 语 言 不 强 
制 转换 枚 举 类 型 变量 为 整数 类 型 。 


6.4.2 FAKE 


子 范围 类 型 是 一 个 序数 类 型 的 连续 子 系列 。 例 如 ，12，…，14 是 整数 的 子 邯 围 。 子 范围 类 
型 由 Pascal 引进 ， 并 被 包括 在 Ada 中 。 没 有 关于 子 邯 围 类 型 的 特殊 的 设计 问题 。 

6.4.2.1 Ada 中 的 设计 

在 Ada 语 言 中 ， 子 范围 被 包括 在 一 类 称 为 子 类 型 (subtype) 的 类 型 中 。 正 如 我 们 曾经 在 第 5 
章 所 陈述 的 ， 子 类 型 完全 不 是 新 的 类 型 ， 它 们 只 是 一 个 新 名 称 ， 用 于 那些 已 有 类 型 的 可 能 受 限 
版 本 。 例 如 ， 考 虑 下 面 的 这 些 声 明 : 


type Days is (Mon, Tue, Wed, Thu, Fri, Sat, Sun); 
subtype Weekdays is Days range Mon..Fri; 
subtype Index is Integer range 1..100; 


在 这 些 例子 中 ， 已 有 类 型 上 所 具有 的 限制 是 这 些 类 型 可 能 值 的 范围 。 所 有 为 父 类 型 定义 的 
操作 也 被 定义 给 子 类 型 ， 除 了 在 说 明 欧 围 之 外 的 赋值 。 例 如 ， 在 下 面 的 语句 中 : 


Dayl : Days; 
Day2 : Weekdays; 


Day2 := Dayl; 


如 果 Day1 的 值 不 是 Sat 或 者 Sun， 这 种 赋值 就 是 合法 的 。 

编译 器 必须 对 每 一 个 子 缉 围 类 型 变量 的 赋值 都 产生 范围 检测 代码 。 尽 管 类 型 的 检测 是 在 编 
译 时 进行 ， 而 子 范围 类 型 的 检测 则 在 运行 时 进行 。 

用 户 定 义 的 序数 类 型 的 最 普遍 应 用 之 一 是 数组 索引 , 关于 这 些 我 们 将 在 第 6.5 节 中 进行 讨论 。 
数组 索引 也 能 够 被 用 作 循环 变量 。 事 实 上 ， 序 数 类 型 的 子 范 围 是 说 明 Ada 中 for 循 环 变量 范围 的 
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唯一 方法 。 

请 注意 ， 子 范围 类 型 与 在 第 5 章 里 讨论 过 的 Ada 的 派生 类 型 非常 不 同 。 例 如 ， 考 虑 下 面 的 类 
型 声明 ， 

type Derived Small Int is new Integer range 1..100; 

subtype Subrange Small Int is Integer range 1..100; 


Derived Small Int 和 Subrange Small Int 这 两 种 类 型 的 变量 有 相同 的 合法 值 的 范 
围 和 都 继承 了 Integer 的 操作 。 然 而 ， 类 型 Derived_small Int 的 变量 与 任何 Integer 类 
型 都 不 兼容 。 而 类 型 subrange_small_Int 的 变量 与 Integer 类 型 的 变量 及 常量 以 及 任何 
Integer 的 子 类 型 都 兼容 。 

6.4.2.2 评估 

子 范 围 类 型 使 得 读者 们 清楚 了 子 类 型 的 变量 只 能 储存 一 定 范 围 内 的 值 ， 这 样 提 高 了 可 读 性 。 
可 靠 性 也 由 于 子 范 围 类 型 的 使 用 而 得 到 了 增强 ， 因 为 如 果 将 声明 范围 以 外 的 值 赋 给 一 个 子 范围 
变量 ， 这 将 被 编译 器 (在 所 赋 的 值 为 字面 常量 值 的 情形 下 ) 或 者 运行 时 系统 (在 所 赋 的 值 为 变 
量 或 表达 式 的 情形 下 ) 发 现 为 一 个 错误 。 奇 怪 的 是 在 当代 语言 中 ， 只 有 Ada 95 具 有 子 范围 类 型 ， 


6.4.3 实现 用 户 定义 的 序数 类 型 


如 前 所 述 ， 枚 举 类 型 通常 被 实现 为 整数 。 但 如 果 不 对 枚 举 类 型 的 值 的 范围 以 及 操作 施加 限 
制 的 话 ， 这 将 不 会 有 助 于 提高 可 靠 性 。 

于 邯 围 类 型 的 实现 方式 与 其 父 类 型 的 实现 完全 相同 ， 唯 一 的 差别 是 ， 编 译 器 必须 隐 式 地 对 
于 范围 变量 或 表达 式 的 每 一 次 赋值 进行 范围 检测 。 虽 然 这 样 增加 了 代码 的 规模 以 及 执行 的 时 间 ， 
但 通常 认为 这 种 代价 是 值得 付出 的 。 除 此 之 外 ， 一 个 良好 的 优化 编译 器 可 以 优化 掉 一 些 这 样 的 
检测 。 


6.5 数组 类 型 


数组 是 同 种 类 的 数据 元 素 的 聚集 ， 其 中 每 一 单个 元 素 的 标识 是 由 这 个 元 素 在 聚集 中 所 占据 
的 位 置 相对 于 第 一 个 元 素 的 位 置 来 确认 。 在 程序 中 对 一 个 数组 元 素 的 引用 ， 常 常 包括 了 一 个 或 
者 多 个 非常 量 的 下 标 。 这 种 引用 需要 额外 的 运行 时 的 计算 来 确定 被 引用 的 存储 空间 位 置 。 数 组 
的 单个 数据 元 素 具 有 已 经 定义 的 类 型 ， 或 者 是 基本 类 型 或 者 是 其 他 类 型 。 大 部 分 计算 机 程序 需 
要 模拟 数值 集合 ， 集 合 中 的 数值 都 是 相同 类 型 的 ， 并 且 必 须 使 用 相同 的 处 理 方式 。 因 而 对 于 数 
组 所 存在 的 普遍 需求 是 显而易见 的 。 


6.5.1 设计 问题 


数组 所 特有 的 主要 设计 问题 如 下 : 

* 什 么 类 型 用 于 下 标 是 合法 的 ? 

e 应 该 对 元 素 引 用 中 的 下 标 表达 式 进行 范围 检测 吗 ? 

“什么 时 候 下 标 范围 被 绑 定 ? 

“什么 时 候 对 数组 进行 存储 空间 的 分 配 ? 

“ 应 该 允许 参差 不 齐 的 或 者 整齐 长 方形 的 多 维 数组 吗 ? 或 者 ， 这 两 种 数组 都 应 该 被 允许 ? 
* 当 数 组 被 分 配 了 存储 空间 时 ， 能 否 实施 数组 的 初始 化 ? 

* 如 采 允 许 片 的 话 ， 应 该 允许 什么 类 型 的 片 ? 
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”在 下 面 的 几 个 小 节 里 ， 我 们 将 讨论 在 儿 种 最 常用 的 程序 设计 语言 中 进行 数组 设计 选择 的 
例子 。 


6.5.2 数组 与 下 标 


数组 中 特定 元 素 的 引用 是 通过 一 种 两 个 层次 的 语法 机 制 进行 的 ， 其 中 的 第 一 个 部 分 是 数组 
名 ， 第 二 个 部 分 则 是 一 个 可 能 为 动态 的 选择 器 ， 它 包括 了 一 项 或 多 项 的 下 标 或 索引 。 如 末 在 一 
个 引用 中 ， 所 有 下 标 都 为 常量 ， 这 个 选择 器 是 静态 的 ， 否 则 选择 器 就 是 动态 的 。 可 以 认为 选择 
操作 是 从 数组 名 与 下 标 值 到 数组 中 元 素 的 一 种 映射 。 事 实 上 ， 有 时 将 数组 称 为 有 限 上 映射 。 这 种 
映射 可 以 用 符号 表示 成 为 

数组 _ 名 (下 标 _ 值 _ 表 ) 一 元 素 

数组 引用 的 语法 十 分 通用 : 数组 名 后 面 跟 随 一 系列 下 标 ， 使 用 圆 括号 或 方 括号 将 下 标 括 起 
来 。 如 果 一 种 语言 中 的 多 维 数组 是 数组 中 的 数组 ， 则 每 一 个 下 标 都 会 出 现在 自己 的 括号 中 。 使 
用 圆 括 号 存在 的 一 个 问题 是 ， 圆 括号 也 常 被 用 来 包括 子 程序 的 调用 参数 ， 这 会 使 得 数组 引用 与 
函数 调用 在 形式 上 完全 一 样 。 例 如 ， 考 虑 下 面 的 Ada 赋值 语句 : 


Sum := Sum + B(I); 


因为 圆 括号 被 用 于 子 程序 参数 ， 又 被 用 于 Ada 中 数组 的 下 标 ， 程 序 的 阅读 者 以 及 编译 器 都 
必须 通过 其 他 信息 来 确定 这 条 赋值 语句 中 的 B(I) 究竟 是 函数 调用 还 是 对 数组 中 元 素 的 引用 ? 这 
给 读者 带 来 一 些 不 必要 的 麻烦 。 

Ada 语 言 的 设计 人 员 特 别 选用 圆 括号 来 包括 下 标 ， 这 样 表达 式 中 的 数组 引用 与 函数 调用 之 
间 就 一 致 起 来 ， 虽 然 这 具有 潜在 的 可 读 性 问题 。 他 们 之 所 以 做 出 这 种 选择 ， 是 基于 这 样 的 事实 : 
即 无 论 数组 元 素 的 引用 还 是 函数 的 调用 ， 在 实质 上 都 是 一 种 映射 。 数 组 元 素 的 引用 将 下 标 映射 
到 这 个 数组 中 的 某 一 特定 元 素 之 上 ; 函数 的 调用 将 实 参 映 
射 到 函数 定义 之 上 ， 并 且 最 终 映射 到 函数 值 上 。 

基于 C 的 语言 使 用 方 括 号 来 界定 数组 下 标 。 ee ae 

在 一 个 数组 类 型 中 涉及 了 两 种 不 同 的 类 型 ;元素 的 类 型 ARMIES RAR AE 
和 下 标的 类 型 。 下 标 类 型 通常 为 整数 的 子 范围 ， 但 是 Ada 允 oe 
PRCA BRON bn, MARR, FERM eee ea. 
枚 举 类 型 。 例 如 ，Ada 有 i 


type Week_Day_Type is (Monday, Tuesday, Wednesday, Thurs- 
day, Friday); 
type Sales is array (Week_Day_Type) of Float; 


Ada 的 for 循 环 能 为 它 的 计数 器 使 用 任何 序数 类 型 变量 ， 我 们 将 在 第 8 章 看 到 这 种 情况 。 这 
使 得 可 以 方便 地 处 理 带 有 序数 下 标的 数组 。 

早期 的 程序 设计 语言 不 要 求 下 标 范 围 的 隐 式 检测 。 下 标的 范围 错误 在 程序 中 前 见 ， 因 而 范 
围 检测 的 要 求 是 决定 语言 可 靠 性 的 重要 因素 。 在 当代 语言 中 ，C、C++、Perl 和 Fortran 不 要 求 下 
标 范 围 的 检测 ， 但 是 Java、ML 以 及 C# 则 要 求 施 行 下 标 范 围 的 检测 。 默 认 情 况 下 ，Ada 语 言 自 动 
检测 所 有 的 下 标 范 围 ， 但 程序 人 员 也 可 以 取消 这 项 功能 。 

因为 在 Perl 中 ， 数 组 元 素 总 是 标量 ， 标 量 名 用 美元 标记 ($) 开始 (对 数组 元 素 的 引用 使 用 
美元 标记 ， 而 不 是 名 字 中 的 其 他 标记 ) ， 所 以 由 于 所 有 数组 名 都 以 标记 (@) 开始 ， 下 标 显得 比 
较 独 特 。 例 如 ， 在 数组 8list 中 ， 用 $list[1] 来 引用 第 二 个 元 素 。 
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在 下 标 值 是 基于 数组 末尾 的 偏 移 量 时 ，Perl 也 能 用 一 个 负 下 标 引 用 一 个 数组 元 素 。 例 如 ， 
如 采 数 组 eL1ist 有 5 个 元 素 ， 下 标 是 0..4，$1List[-2] 引 用 下 标 为 3 的 元 素 。 在 Perl 中 引用 一 个 
不 存在 的 元 素 产 生 undef， 但 是 不 报告 错误 。 


6.5.3 下 标 绑 定 及 数组 类 别 


下 标的 类 型 以 及 数组 变量 的 绑 定 通常 都 为 静态 的 ， 但 下 标 值 范围 的 绑 定 有 时 为 动态 的 。 

在 一 些 语言 中 ， 下 标 范 围 下 界 的 绑 定 为 隐 式 的 。 例 如 ， 在 基于 C 的 语言 中 ， 是 将 所 有 下 标 
艺 围 的 下 界 固定 为 零 ， 在 Fortran 95 中 ， 则 将 它 默 认为 1， 而 在 其 他 一 些 语言 中 ， ALAA TEAS 
程序 人 员 来 说 明 下 标的 范围 。 

一 共有 五 种 类 型 的 数组 。 这 种 归 类 是 基于 下 标 范围 的 绑 定 ， 存储 空间 的 绑 定 和 分 配 的 存储 
志 位 置 来 定义 的 。 类 别名 表示 这 3 类 的 设计 选择 。 在 前 面 4 个 类 别 中 ， 一 旦 绑 定 了 下 标 范围 ， 并 
且 分 配 了 存储 空间 ， 它 们 在 变量 的 整个 生命 周期 将 保持 固定 。 注 意 ， 当 下 标 范围 是 固定 的 ， 数 
组 不 会 改变 其 大 小 。 

静态 数组 的 下 标 范围 是 静态 地 被 绑 定 的 , 它 的 存储 空间 也 被 静态 分 配 (完成 于 运行 时 之 前 )。 


”静态 数组 的 优点 是 高 效率 ， 不 需要 动态 地 进行 分 配 或 者 解除 分 配 。 


固定 栈 动 态 数组 的 下 标 范围 是 动态 地 被 绑 定 的 ， 但 是 它 的 存储 空间 分 配 则 完成 于 执行 期 
间 ， 当 确立 它 的 声明 语句 之 时 。 固 定 栈 动态 数组 相对 于 静态 数组 的 优越 性 是 空间 效率 。 一 个 
于 程序 中 的 大 数组 可 以 与 另 一 个 子 程序 中 的 大 数组 共享 同一 空间 ， 只 要 这 两 个 子 程序 不 在 同 
时 活跃 。 

栈 动态 数组 的 下 标 范围 是 动态 绑 定 的 ， 它 的 存储 空间 的 分 配 也 是 动态 的 (完成 于 运行 时 )、 
人 看， 一 且 它 的 下 标 范围 被 绑 定 ， 它 的 存储 空间 也 被 分 配 ， 它 们 将 在 变量 的 生存 期 里 保持 不 恋 . 
和合 动态 数组 相对 于 静态 数组 以 及 固定 栈 动态 数组 的 优越 性 是 它 的 灵活 性 。 直 到 将 要 使 用 它 时 才 
需要 知道 这 种 数组 的 大 小 。 

固定 准 动态 数组 类 似 于 固定 栈 动 态 数组 ， 它 的 下 标 范围 是 动态 绑 定 的 ， 并 且 它 与 存储 空间 
的 绑 定 也 是 动态 的 ， 但 这 两 种 绑 定 在 分 配 存储 空间 之 后 就 成 为 国定 不 变 的 。 与 国定 栈 动态 数组 
不 同 的 十 :固定 堆 动态 数组 的 绑 定 是 在 执行 时 用 户 程序 发 出 请 求 时 进行 的 ， 此 外 ， 它 的 存储 空 
间 是 在 堆 中 分 配 ; 而 不 是 从 栈 中 分 配 。 

堆 动态 数组 的 下 标 范围 的 绑 定 以 及 存储 空间 的 分 配 都 是 动态 的 ， 而 且 在 数组 的 生存 期 内 可 
以 进行 任意 次 数 的 改变 。 堆 动态 数组 相对 于 其 他 类 型 数组 的 优越 性 是 它 的 灵活 性 ;在 程序 执行 
期 间 ， 可 以 根据 空间 变化 的 需要 来 改变 数组 的 大 小 ， 可 以 变 大 或 者 变 小 。 下 文 给 出 了 这 五 种 类 
别 数 组 的 例子 。 

在 C 以 及 C++ 的 国 数 中 ， 声 明 时 带 有 static 修 饰 符 的 数组 是 静态 的 。 

任 C 以 及 C++ 的 函数 中 ， 声 明 时 不 具有 static 修 饰 符 的 数组 是 固定 栈 动态 数组 的 范例 

Ada 中 的 数组 可 以 为 栈 动态 的 ， 如 下 面 的 例子 所 示 : 

Get(List Len); 

declare 


List : array (1..List_ Len) of Integer; 
begin 


end; 
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在 这 个 例子 中 ， 用 户 输入 数组 List 所 需要 元 素 的 个 数 ， 当 程序 执行 到 达 declare 块 时 , 就 
动态 地 进行 存储 空间 的 分 配 。 而 当 执 行 到 达 程 序 块 的 末尾 时 ， 数 组 List 则 被 解除 分 配 。 

C 和 C++ 语言 也 提供 固定 堆 动 态 数 组 。 标 准 库 国 数 malloc 和 free (它们 是 一 般 的 堆 分 配 和 
解除 分 配 操作 ) 能 够 用 于 普通 的 C 数 组 。C++ 则 使 用 new 和 delete 操 作 符 来 管理 堆 存 储 空间 。 
数组 被 处 理 为 指 向 存储 单位 集合 的 指针 ， 而 且 这 些 指针 可 以 被 索引 ， 第 6.9.5 节 将 讨论 这 些 内 容 。 

Fortran 95 也 支持 固定 堆 动态 数组 。 

在 Java 中 ， 所 有 数组 都 是 固定 堆 动态 数组 。 这 些 数组 一 经 建立 ， 它 们 将 保持 同样 的 下 标 范 
围 及 存储 空间 。C# 也 提供 固定 堆 动态 数组 。 


C# 还 包括 了 第 二 种 数组 类 ArrayList， 以 提供 堆 动 态 
数组 。 这 种 类 中 的 对 象 在 建立 时 不 具有 任何 元 素 ， 例 如 


Fortran I 将 数组 下 标 数 目 限 
制 为 3， 因 为 在 语言 设计 的 当时 ， 
通过 使 用 方法 Add 将 元 素 加 入 到 对 象 中 ， 例 如 主要 关心 的 是 执行 效率 ，Fortran I 
ArrayList.Add(nextOne) ) ; 的 设计 人 员 使 用 IBM 704 机 的 检 
Java 包 含 了 与 C# 的 ArrayList 相 似 的 结构 ， 除 了 不 支 。 案 等 行 器 创造 了 行 取 三 维 数组 元 
持 下 标 之 后 ， 其 他 都 相同 (必须 通过 get 和 set 方 法 来 访问 。 素 的 快速 方法 。Fortran IV 是 第 一 
TE. 种 实现 于 IBM 7094 机 器 之 上 、 上 有 具 


通过 使 用 push (在 数组 的 尾部 放置 一 个 或 多 个 新 元 素 ) BOS ee 
和 unshift (在 数组 的 开始 处 放置 一 个 或 多 个 新 元 素 ), 或 的 下 标 多 达 七 维 。， 大 多 数 的 当代 
通过 赋 给 数组 一 个 超过 其 最 当前 下 标的 值 ，Per 数 组 能 够 增 语言 部 已 经 没有 了 这 种 限制 、 
长 。 通 过 赋值 空 列 表 0， 数 组 能 缩小 为 0 个 元 素 。 数 组 的 大 
小 等 于 最 大 下 标 加 1。 

像 Perl 一 样 , JavaScript 允 许 使 用 push 和 unshift 方 法 让 数组 扩展 和 设置 为 空 列表 使 其 缩小 。 
然而 ， 它 不 支持 下 标 。 

JavaScript 数 组 是 松散 的 ， 这 意味 着 下 标 值 不 需要 连续 。 例 如 ， 假 如 我 们 有 称 为 1ist 的 数 
组 ， 它 有 10 个 元 素 ， 下 标 为 0…9。9 考虑 赋值 语句 


list[50]=42; 


现在 ， 列 表 有 11 个 元 素 ， 长 度 为 51。 具 有 下 标 11…49 的 元 素 没 有 定义 ， 因 此 不 需要 存储 空 
间 。 在 JavaScript 数 组 中 ， 对 不 存在 元 素 的 引用 将 产生 undefined。 

在 Python 和 Ruby 中 的 数组 仅 能 够 通过 添加 元 素 或 连接 其 他 数组 方法 。Ruby 支 持 负 下 标 ， 但 
是 Python 不 支持 。Python 和 Ruby 都 能 删除 元 素 或 数组 片 。 在 Python 中 ， 对 不 存在 的 元 素 的 引用 
导致 运行 时 错误 ， 因 此 在 Ruby 中 相似 的 引用 将 产生 nil， 并 不 报告 错误 。 


6.5.4 异 构 数组 


腊 构 数组 是 指 具 有 不 同类 型 元 素 的 数组 。Perl、Python、JavaScript 和 Ruby 都 支持 这 类 数组 。 
在 所 有 这 些 语言 中 ， 数 组 都 是 在 堆 上 动态 分 配 的 。 

在 Perl 中 ， 数 组 元 素 能 够 是 包含 数字 、 字 符 串 和 引用 的 标量 类 型 的 任意 混合 。JavaScript 是 
一 种 动态 类 型 语言 ， 任 何 数组 元 素 都 能 是 任何 类 型 。Python 和 Ruby 数 组 是 对 任何 类 型 的 对 象 的 
引用 。 


ArrayList intList = new ArrayList(); 


O ”下 标 范 围 能 很 容易 地 写 1000...1009。 
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当 我 们 在 本 章 后 面部 分 讨论 数组 时 ， 异 构 数组 也 会 谈 及 到 。 


6.5.5 数组 初始 化 


一 些 语言 提供 了 在 分 配 数组 的 存储 空间 之 后 设 定数 组 初始 值 的 方法 。 在 Fortran 95 中 ， 可 以 
通过 在 数组 声明 中 给 数组 赋予 一 组 数值 ， 从 而 实施 数组 的 初始 化 。 当 数组 为 一 维 时 ， 这 组 数值 
就 是 一 列 使 用 括号 与 斜 线 包围 的 字面 常量 。 例 如 ， 我 们 可 以 有 


Integer, Dimension (3) :: List = (/0, 5, 5/) 


C, C++, Javal ARCH EIF ett AA sett, (ERE TRTI. 4 PCH AA 


int list .f].=-{(4, 5, 7, 83}; 


即 由 编译 器 设 定 了 数组 的 长 度 。 这 种 方法 十 分 方便 ,但 却 具有 代价 。 它 有 实际 上 消除 由 系 
统 来 发 现 程序 人 员 的 某 类 错误 的 可 能 性 ， 比 如 说 ， 错 误 地 漏 掉 了 数组 中 的 一 个 数值 。 

正如 在 6.3.2 节 讨论 的 ，C 和 C++ 语言 中 的 字符 串 被 实现 成 char 数 组 。 可 以 将 这 些 数 组 的 初 
值 设 为 串 常 量 ， 例 如 

char name [] = "freddie"; 

数组 name 具 有 八 个 元 素 ， 因 为 所 有 串 都 由 空 字 符 null (F) 结束 ， 空 字符 是 系统 为 字符 常 
量 隐 式 提供 的 。 

在 C 和 C++ 中 的 字符 串 数 组 也 能 够 使 用 字符 字面 常量 来 设 定 初 值 。 在 这 种 情况 下 ， 数 组 是 指 
加 字符 的 一 个 指针 。 例 如 ， 


char *names [] = {"Bob", "Jake", "Darcie"}; 

这 个 例子 说 明了 C 和 C++ 中 字符 字面 常量 的 性 质 。 在 前 面 的 例子 中 ， 曾 经 使 用 一 个 字符 串 字 
面 疝 量 来 为 chnar 数 组 name 赋 以 初 值 ， 在 这 里 将 字面 常量 处 理 为 chaz 数 组 。 但 是 在 后 面 的 这 一 
个 例子 (names) 中 ， 则 将 字面 常量 处 理 为 指向 字符 的 指针 ， 因 而 这 个 数组 是 指向 字符 的 指针 
的 数组 。 例 如 names[0] 是 指向 文字 字符 数组 中 的 字母 “B” 的 指针 。 在 这 个 数组 里 包含 了 字符 
“B”, “o”, “b” 以 及 空 字符 nul1。 

在 Java 中 使 用 类 似 的 语法 来 对 对 象 String 的 引用 数组 赋予 定义 并 实施 初始 化 。 例 如 ， 


String[] names = ["Bob", "Jake", "Darcie"]; 


Ada 语 言 提 供 了 两 种 在 声明 语句 中 设 定数 组 初 值 的 机 制 : 1. 通 过 将 它们 按 将 要 被 存储 的 顺序 
排列 ，2. 通 过 使 用 => 操作 符 (这 个 操作 符 在 Ada 中 被 称 为 arrow) 将 它们 直接 赋 给 一 个 索引 地 
址 。 例 如 下 面 的 例子 : 


List : array (1..5) of Integer := (1, 3, 5, 7, 9); 
Bunch : array (1..5) of Integer := (1 => 17, 3 => 34, 
others => 0); 
在 上 面 的 第 一 条 语句 中 ， 数 组 List 中 的 所 有 元 素 都 被 赋予 了 初 值 ， 这 些 数值 出 现 的 次 序 就 
是 它们 在 数组 中 的 元 素 位 置 。 在 第 二 条 语句 中 ,使 用 了 直接 赋值 方法 来 给 第 一 和 第 三 个 数组 元 素 
设 定 初 值 ， 而 使 用 others 子 句 给 其 余 元 素 设 定 初 值 。 这 些 由 括号 包括 的 数值 集合 称 为 聚集 值 。 


6.5.6 数组 操作 


数组 操作 是 将 数组 作为 一 个 单位 来 进行 的 操作 。 最 常用 的 数组 操作 是 赋值 、 连 接 、 比 较 
(相等 和 不 相等 ) 和 片 (在 6.5.8 节 中 讨论 )。 
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除了 通过 Java、C++ 和 C# 的 方法 ， 基 于 C 的 语言 不 提供 任何 数组 操作 。Perl 支 持 数组 赋值 : 
但 是 不 支持 比较 。 

Ada 克 许 数组 的 赋值 ， 包 括 那些 右边 为 聚集 值 而 非 数组 名 称 的 赋值 。Ada 还 提供 了 由 符号 及 
说 明 的 连接 ， 这 种 连接 被 定义 于 两 个 一 维 数组 之 间 ， 以 及 一 个 一 维 数组 与 一 个 标量 之 闻 。 几 平 
在 Ada 中 的 所 有 类 型 都 具有 内 建 的 等 于 关系 操作 符 和 不 等 于 关系 操作 符 。 

Python 数组 的 元 素 是 对 对 象 的 引用 。Python 提 供 了 数组 赋值 操作 ， 尽 管 它 只 是 引用 的 改变 。 
Python 也 有 数组 连接 (+) 和 元 素 成 员 (in)。 它 包括 两 个 不 同 的 比较 操作 符 ， 一 个 操作 符 决定 
两 个 变量 是 否 引用 同一 个 对 象 (is) ， 另 一 个 操作 符 比较 在 引用 对 象 中 的 所 有 对 应 的 对 象 ， 而 
NS EMEA BR, wF (==), 

与 Python 一 样 ，Ruby 数 组 的 元 素 是 对 对 象 的 引用 。 同 样 ， 当 Ruby 在 两 个 数组 中 使 用 == 操 作 
符 时 ， 只 有 在 两 个 数组 有 相同 的 长 度 ， 并 且 对 应 的 元 素 都 相等 时 ， 结 果 才 为 真 ， Ruby 的 数组 能 
用 Array 方 法 连接 。 

Fortran 95 包 括 了 一 些 被 称 为 元 素 的 (elemental) 数组 操作 ， 它们 是 在 数组 元 素 对 之 间 进 行 的 
操作 。 例 如 ， 在 两 个 数组 之 间 的 加 法 操作 符 (+) 将 产生 一 个 数组 ， 其 元 素 为 这 两 个 数组 元 素 对 之 
和 。 可 以 为 任何 大 小 或 形状 的 数组 将 赋值 操作 符 、 算 术 操作 符 、 天 系 操作 符 以 及 逻辑 操作 符 ， 重 
载 为 数组 操作 符 。Fortran 95 还 包括 了 进行 矩阵 乘法 、 年 阵 转 置 以 及 矢量 点 积 的 内 部 函数 或 库 函 数 。 

数组 及 其 操作 是 APL 语 言 的 核心 ，APL 是 有 史 以 来 功能 最 强 的 数组 处 理 语言 ， 然而 由 于 它 
较为 用 誉 和 缺乏 对 后 继 语 言 的 影响 力 ， 我 们 只 在 这 里 对 它 的 数组 操作 做 简略 的 介绍 。 

在 APL 语 言 中 ， 四 种 基本 的 算术 操作 都 是 为 矢量 (一 维 数 组 ) 和 和 矩阵 以 及 标量 操作 数 而 定 
义 的 。 例 如 ， 


A+B 

是 有 效 的 表达 式 ， 在 这 里 A 和 B 可 以 是 标量 变量 、 矢 量 或 者 矩阵 ， 

APL 包 括 了 一 组 矢量 和 和 矩阵 的 一 元 操作 符 , 我 们 将 其 中 的 一 些 列举 如 下 (在 这 里 , VARS, 
而 M 为 矩阵 ): 

OV MEVE 

OM 颠倒 M 的 列 

OM 颠倒 M 的 行 

OM M 的 转 置 (将 行 变 成 列 ， 或 者 反 过 来 ) 

EM HEM 

APL 还 包括 了 几 种 特殊 操作 符 ， 它 们 使 用 其 他 操作 符 作为 操作 数 。 这 类 操作 符 的 一 个 例子 
就 是 内 积 操 作 符 ， 它 用 点 号 (.) 表示 。 这 个 操作 符 的 两 个 操作 数 都 是 二 元 操作 符 ， 例 如 ， 


FX 


征 一 个 新 的 操作 符 ， 它 作用 于 两 个 变量 ， 矢 量 或 者 矩阵 。 它 首 先 将 两 个 参数 的 对 应 元 素 相 


乘 ， 然 后 取得 其 结果 的 和 。 例 如 ， 如 果 R 和 了 B 都 是 矢量 ， 
A XB 
则 是 A 和 B 的 数学 内 积 ( 即 ，A 和 B 中 对 应 元 素 的 乘积 的 矢量 )、 语句 
A +.X B 


则 古 A 和 B 的 内 积 之 和 。 如 果 A 和 B 为 矩阵 ， 这 个 表达 式 就 说 明了 A 和 B 的 矩阵 乘积 。 
APL 中 的 特殊 操作 符 实际 上 是 函数 的 形式 ， 我 们 将 在 第 15 章 给 以 描述 。 


tr 
CN 
oO 
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6.5.7 长 方形 数组 与 参差 不 齐 数组 


长 方形 数组 是 一 个 多 维 数组 , 数组 中 的 所 有 行 都 具有 同样 数目 的 元 素 ， 数 组 中 的 所 有 列 也 都 
具有 同样 数目 的 元 素 。 长 方形 数组 准确 地 模拟 了 表格 。 

参差 不 齐 数组 是 ， 其 中 行 的 长 度 不 必 相 同 。 例 如 ， 一 个 参差 不 齐 和 矩阵 可 能 包括 了 3 行 ， 其 中 
的 一 行 有 5 个 元 素 ， 另 一 行 有 7 个 元 素 ， 再 另 一行 有 12 个 元 素 。 列 的 长 度 也 不 必 相 同 。 对 于 更 高 
维 数 的 数组 也 是 如 此 。 因 而 ， 如 果 一 个 数组 具有 第 三 维 〈 层 ) 的 话 ， 其 中 的 每 一 层 都 可 以 具有 
不 同 数目 的 元 素 。 如 果 将 多 维 数组 构造 为 数组 之 数组 ， 我 们 就 可 以 得 到 参差 不 齐 数 组 。 例 如 可 
以 将 一 个 矩阵 构造 为 数组 的 数组 。 

C，C++ 以 及 Java 支 持 参 差 不 齐 数组 ， 而 并 不 支持 长 方形 数组 。 在 这 些 语 言 中 ， 对 于 一 个 多 
维 数组 中 的 元 素 的 引用 使 用 方 括号 来 指示 ， 每 一 对 方 括号 分 别 对 应 于 数组 的 一 维 。 例 如 ， 

myArray[3][7] 

Fortran, Ada[ 以 及 C# 支 持 长 方形 数组 。(C# 也 支持 参差 不 齐 数组 。) 在 这 些 语言 中 ， 将 所 有 对 
数组 元 素 的 引用 的 下 标 表达 式 都 放置 于 一 对 方 括号 中 。 例 如 ， 


myArray[3, 7] 


6.5.8 H 


数组 的 片 是 数组 中 的 一 个 子 结构 。 例 如 ， 如 果 A 为 一 个 矩阵 ，A 的 第 一 行 就 是 一 个 可 能 的 片 ， 
同样 ，A 的 最 后 一 行 以 及 第 一 列 也 可 能 是 片 。 重 要 的 是 要 知道 ， 片 并 不 是 一 个 新 的 数据 类 型 ， 
它 只 是 将 数组 的 一 部 分 作为 一 个 单位 来 引用 的 一 种 机 制 。 如 果 一 种 语言 中 的 数组 不 能 够 被 处 理 
为 一 些 单位 ， 这 种 语言 就 不 能 够 处 理 片 。 


考虑 下 面 Fortran 95 中 的 声明 : 

Integer, Dimension (10) :: Vector 
Integer, Dimension (3, 3) :: Mat 
Integer, Dimension (3, 3, 4) :: Cube 


前 面 讲 过 ，Fortran 中 数组 下 标的 下 限 是 1。Vector (3:6) 是 一 个 四 个 元 素 的 数组 ， 它 包 
仿 Vector 中 第 三 到 第 六 个 元 素 ; Mat ( : ,2 ) 表 示 的 是 Mat 的 第 二 列 ，Mat (3, : ) 表 示 的 是 
Mat 的 第 三 行 。 所 有 的 这 些 引 用 都 可 以 作为 一 维 数 组 来 使 用 。 所 有 对 数组 中 片 的 引用 都 可 以 处 
理 成 为 就 像 它们 是 剩余 维 数 的 数组 一 样 。 因 而 可 以 将 一 个 片 引 用 ， 例 如 Cube (:, :, 2), & 
法 地 赋 给 Mat。 片 也 可 以 出 现在 赋值 语句 的 左边 。 例 如 ， 可 以 将 一 个 一 维 数组 赋 给 一 个 矩阵 的 
片 。 图 6-4 显 示 了 Mat 和 Cube 的 几 个 片 。 

Fortran 95 可 以 说 明 更 复杂 的 片 。 例 如 ，Vector (2:10:2) 是 包括 了 Vector 中 第 二 、 第 四 、 第 
六 、 第 八 和 第 十 个 元 素 的 五 个 元 素 的 数组 。 片 也 可 以 具有 一 个 现 有 数组 元 素 的 不 规则 的 排列 。 例 
如 ，Vector ((/3，2，1，8/)) 是 一 个 具有 Vector 中 第 三 、 第 二 、 第 一 和 第 八 个 元 素 的 数组 。 

Perl 文 持 两 种 形式 的 片 : 列表 式 的 特定 的 下 标 或 范围 式 的 下 标 。 例 如 ， 

@list[1..5] = @list2[3, 5, 7, 9, 13]; 

注意 ， 因 为 片 是 数组 〈 不 是 标量 ) ， 所 以 片 引 用 使 用 数组 名 ， 而 不 是 标量 名 。Python 也 支持 
简单 的 和 复杂 的 数组 片 。 例 如 ，1List[1:20:21 引 用 从 下 标 1 开 始 的 每 一 个 其 他 的 列表 元 素 ; 
list[10:]3| 用 所 有 下 标 大 于 10 的 元 素 (包括 下 标 等 于 10 的 元 素 ) ; list[ :5] 引 用 所 有 下 标 
小 于 5 的 元 素 (不 包括 下 标 等 于 5 的 元 素 )。 

Ruby 文 持 两 种 片 ， 一 种 片 的 元 素 由 开始 下 标 和 结束 下 标 (不 包括 结束 下 标 值 ) 指定 ， 另 一 
种 是 ， 第 一 个 给 定 的 下 标 指定 第 一 个 元 素 ， 第 二 个 指定 片 中 元 素 的 个 数 。 
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Mat (2:3, <) 


SS _ 


4 
A 












EER 
WM 
PL LL 


Cube (2) 3; 2) Cube (fp Te 233) 
图 6-4 Fortran 95 中 片 的 例子 
在 Ada 中 只 允许 有 高 度 受 限 的 片 ， 即 那些 由 一 维 数组 的 连续 元 素 组 成 的 片 。 例 如 ， 如 果 
List 古 一 个 具有 下 标 范 围 (1，…，100) 的 数组 List (5. .10) 即 是 List 的 一 个 片 ， 它 包括 了 
下 标 从 5 到 10 的 6 个 List 元 素 。 如 在 6.3.2 节 的 讨论 ， 一 个 String 类 型 的 片 被 称 为 子 串 引用 


(Substring reference ) 。 





6.5.9 评估 


事实 上 ， 所 有 的 语言 都 包括 了 数组 。 数 组 结构 简单 ， 并 且 已 经 被 很 好 地 开发 。 自 从 Fortran I 
引入 数组 以 来 ， 数 组 所 获得 的 主要 的 进步 是 将 所 有 的 序数 类 型 包括 进来 作为 可 能 的 下 标 类 型 ， 
当然 还 有 动态 数组 。 尽 管 数组 非常 基本 和 重要 ， 涉 及 它们 的 设计 争议 却 很 少 。 


6.5.10 数组 类 型 的 实现 


数组 的 实现 比 简单 类 型 的 实现 (如 整数 ) 需要 更 多 的 编译 时 工作 量 。 进 行 数组 元 素 存 取 的 
代码 必须 产生 于 编译 时 ， 还 必须 在 运行 时 执行 这 种 代码 ， 以 产生 元 素 的 地 址 。 对 于 下 面 这 样 的 
引用 将 要 访问 的 地 址 ， 没 有 预先 计算 的 办 法 

list[k] 

一 个 一 维 数组 是 一 串 相 邻 的 存储 单位 。 假 设 定义 数 组 List 具 有 下 限 为 1 的 下 标 范 围 。1ist 
的 存 取 函数 通常 具有 这 样 的 形式 

地 址 (1ist [k]) = 地 址 (list [1]) + (k - 1) * 元 素 的 大 小 

可 以 将 它 简化 为 

地 址 (1ist [k]) = (地 址 (list [1]) - 元 素 的 大 小 ) + (k > 元 素 的 大 小 ) 

这 里 ， 加 法 中 的 第 一 个 操作 数 是 这 个 存 取 函 数 的 常量 部 分 ， 而 第 二 个 操作 数 则 是 其 变量 
部 分 。 


N 
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如 果 将 元 素 类 型 静态 地 绑 定 ， 并 且 数 组 与 存储 空间 也 是 静态 地 绑 定 ， 那 么 就 能 够 在 运行 时 
之 前 计算 常量 部 分 的 值 ， 只 将 加 法 和 乘法 操作 留 在 运行 时 进行 。 如 果 数 组 的 基 址 ， 也 即 起 始 地 
址 ， 是 直到 运行 时 才 获 知 ， 则 必须 在 数组 被 分 配 存 储 空间 之 时 进行 减法 。 

对 具有 任意 下 限 的 数组 实施 存 取 的 函数 ， 它 的 一 般 形式 为 

地 址 (LIist[k]) = 地 址 (List[ 下 限 ]) + ((k -下 限 ) * 元 素 的 大 小 ) 

图 6-5 显 示 一 个 一 维 数组 的 编译 时 描述 符 所 可 能 具有 的 形 
式 。 描 述 符 包括 了 构造 存 取 函 数 所 必需 的 信息 。 如 果 不 进 行 运 
行 时 下 标 范围 的 检测 ， 并 且 所 有 的 属性 都 为 静态 ， 那 么 在 执行 
期 间 只 需要 存 取 函 数 ， 而 不 需要 描述 符 。 如 果实 施 运行 时 下 标 
范围 的 检测 ， 那 么 就 可 能 需要 将 这 些 下 标 范围 储存 于 一 个 运行 
时 的 描述 符 中 。 如 果 某 一 数组 类 型 的 下 标 范围 为 静态 的 ， 那 么 
就 可 以 将 这 种 范围 与 进行 检测 的 代码 结合 起 来 ， 从 而 消除 对 运 
行 时 描述 符 的 需要 。 如 果 描 述 符 中 有 任何 一 项 被 动态 地 绑 定 ， 
那么 在 运行 时 就 必须 维护 描述 符 中 的 这 些 项 。 图 6-5 一 维 数组 的 编译 时 描述 符 

多 维 数组 的 实现 比 一 维 数组 的 实现 更 复杂 ， 虽 然 到 多 维 数 的 扩展 相对 简单 。 硬 件 存储 器 是 
线性 的 ， 即 它 通常 为 字 节 的 简单 序列 。 因 而 具有 二 维 或 多 维 数据 类 型 的 值 就 必须 被 映射 到 一 维 
的 存储 器 上 。 有 两 种 常用 的 方法 可 以 将 多 维 数组 映射 到 一 维 ， 即 按 行 存放 和 按 列 存放 。 在 按 行 
存放 (row major order) 的 方法 中 ， 第 一 个 下 标 为 下 标 下 限 值 的 数组 元 素 被 首先 储存 ， 接 着 储存 一 
的 是 第 一 个 下 标 为 第 二 个 值 的 元 素 ， 依 此 类 推 。 如 果 这 个 数组 是 一 个 矩阵 ， 则 可 以 按 行 存储 。 
例如 ， 如 果 某 个 矩阵 具有 数值 

3 4 7 

6 2 5 

1 3 8 

按照 按 行 存放 的 方法 可 以 将 它 储存 为 

Bs Goats Be Se Oy in oe So | 

在 按 列 存放 的 方法 中 ， 最 后 一 个 下 标 为 下 标 下 限 值 的 数组 元 素 被 首先 储存 ， 紧 接着 储存 的 
是 最 后 一 个 下 标 为 第 二 个 数值 的 元 素 ， 依 此 类 推 。 如 果 这 个 数组 是 一 个 矩阵 ， 则 可 以 按 列 存储 。 
如 果 上 述 的 矩阵 例子 是 以 按 列 存放 的 方法 存储 ， 在 存储 器 中 它 将 具有 下 面 的 次 序 : 

Dy Gy Weg Oy ee Os Te Bu 8 

在 Fortran 中 使 用 按 列 存放 方法 ， 其 他 的 语言 使 用 的 是 按 行 存放 方法 。 

了 解 多 维 数组 的 储存 次 序 ， 有 了 时候 十 分 关键 ， 例 如 在 C 程 序 中 ， 当 使 用 指针 来 处 理 数组 的 
情形 。 在 所 有 情况 下 ， 如 果 对 矩阵 元 素 的 存 取 是 以 这 些 元 素 的 储存 顺序 来 进行 ， 则 存 取 速 度 将 
会 比较 快速 ， 因 为 这 将 会 产生 更 多 的 内 存 局 部 性 。9 

我 们 将 讨论 使 用 在 真正 的 具有 多 维 数组 的 语言 的 存 取 函数 。9 一 个 多 维 数组 的 存 取 函数 将 
数组 的 基 址 和 一 组 索引 值 映 射 到 由 这 些 索 引 值 指定 的 元 素 在 存储 器 中 的 地 址 。 一 个 以 按 行 存放 
方法 存储 的 二 维 数组 的 存 取 函数 可 以 由 下 面 的 方法 来 构造 。 一 般 而 言 ， 一 个 元 素 的 地 址 是 结构 
的 基 址 加 元 素 的 大 小 再 乘 以 这 个 元 素 之 前 元 素 的 数目 。 对 于 一 个 按 行 存放 的 和 矩阵， 一 个 元 素 之 
前 的 元 素数 目 是 这 个 元 素 的 行 数 乘 以 行 的 大 小 ， 再 加 上 位 于 这 个 元 素 左边 的 元 素数 目 。 这 些 在 


下 标 类 型 





O 更 好 的 内 存 局 部 性 意味 着 需要 更 少 的 缓冲 来 重新 装填 数据 。 


日 ”基于 C 的 语言 支持 多 维 的 数组 是 数组 的 数组 ， 而 不 是 真正 的 多 维 数组 
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图 6-6 中 给 予 了 举例 说 明 。 在 这 个 例子 中 ， 我 们 使 用 了 简化 假设 ， 即 将 下 标 下 限 都 设 为 1。 
为 了 取得 实际 的 地 址 值 ， 指 定 元 素 之 前 的 元 素数 目 (il la: ee ep Sas 
必须 乘 以 元 素 的 大 小 。 现 在 可 以 将 存 取 函 数 写成 
位 置 (a[i，j]) = a[1，1] 的 地 址 + 
(((( 第 i 行 上 方 的 行 数 ) * ( 行 大 小 ) ) 
+ (第 j 列 左 面 的 元 素数 目 ) ) * 
元 素 大 小 ) 
因为 在 第 i 行 上 方 的 行 数 是 (i 一 1)， 而 且 在 第 j 列 左 
面 的 元 素数 目 是 (j 一 1)， 因 而 我 们 有 


位 置 (ali，jJ]l) = afl, 1] 的 地 址 + ((((i - 1) * n) 
Aj = Ly * 





元 素 大 小 ) 

其 中 "是 每 行 元 素 的 数目 。 可 以 将 这 个 公式 重新 组 织 图 6-6 和 拢 阵 中 元 素 [i，3] 的 位 置 [275 
为 下 面 的 形式 ， 

位 置 (a[i，j]) = a[1，1] 的 地 址 - ((n + 1) * BK) + 

(1 * mn tug) * FERRARA») 

在 这 里 ， 前 面 的 两 项 为 常量 部 分 ， 最 后 一 项 则 是 变量 部 分 。 

对 任意 下 限 进行 一 般 化 处 理 ， 产 生 了 下 面 的 存 取 函 数 ; 

位 置 (a[i，j]) = a[ 行 _ 下 限 ， 列 _ 下 限 ] 的 地 址 + 

(((i - f7_ PPR) * n) + (5 - 下限 ) * 元素 天 水 

其 中 ,“ 行 -下 限 ”为 行 的 下 限 ,“ 列 _ 下 限 ” 为 列 的 下 限 。 又 可 以 将 它 重新 组 织 为 下 面 的 
形式 : 

位 置 (a[i,j]) = a[ 行 下限 ， 列 _ 下 限 ] 的 地 址 - 

((( 行 _ 下 限 * n) + 列 _ 下 限 ) * 元 素 大 小 ) + 
UCL ay t J i 

其 中 ， 前 面 的 两 项 为 常量 部 分 ， 最 后 一 项 是 变量 部 分 。 可 以 相对 容易 地 将 这 个 公式 一 般 化 
到 任意 的 维 数 。 

对 于 一 个 数组 的 每 一 维 ， 它 的 存 取 函 数 需 要 有 一 个 加 
法 指令 和 一 个 乘法 指令 。 因 此 ， 要 访问 一 个 具有 几 个 下 标 
的 数组 中 元 素 ， 具 有 相当 高 的 代价 。 图 6-7 显 示 了 一 个 多 
ERAGE NRT B T 


片 将 存储 映射 函数 的 复杂 性 再 提高 到 了 另 一 个 层次 ， 
为 了 说 明 这 一 点 ， 考 虑 一 个 具有 一 个 矩阵 和 一 个 数组 的 程 
序 ， 并 将 矩阵 的 一 列 赋 给 数组 : 


Integer, Dimension (10, 5) :: Mat 
Integer, Dimension (10) :: List 





List = Mat (123; 3) 图 6-7 一 个 多 维 数组 的 编译 时 描述 符 
假设 映射 是 按 行 存放 ， 并 且 元 素 的 大 小 为 1， 和 矩阵 

Mat 的 存储 映射 函数 为 
位 置 (Mat [i, j]) = Mat [1, 1] 的 地 址 + ((i - 1) * 5 + (j= 1)) * 1 


tN 
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= (Mat [1, 1] 的 地 址 ~ 6) + ((5 * i) +j) 


Fro|FaMat [1:3,3] 的 存储 映射 函数 为 
位 置 (Mat [i, 3]) = Mat [1, 1] 的 地 址 + ((i -1)*5+(3- 1))*1 
= (Mat [1, 1] 的 地 址 - 3) + (5 * i) 
注意 ， 这 个 映射 与 任何 其 他 的 一 维 数组 存 取 函数 具有 完全 相同 的 形式 ， 只 是 由 于 其 基本 数 
组 是 二 维 的 ， 而 有 不 同形 式 的 常量 部 分 。 
通过 让 i 来 取 Mat 中 第 一 维 下 标 范 围 (1:3) 中 的 值 ， 就 能 够 找到 从 Mat 中 赋 给 List 的 元 素 。 


6.6 关联 数组 


关联 数组 是 一 些 数据 元 素 的 无 序 集合 ， 通 过 使 用 同样 数目 的 、 被 称 为 关键 码 (key) 的 值 对 
这 些 数据 元 素 进行 索引 。 在 非 关联 数组 中 , 就 不 需要 储存 索引 (因为 数据 元 素 所 具有 的 规律 性 )， 
从 而 在 相关 数组 中 ， 必 须 将 用 户 定义 的 关键 码 储存 在 这 个 结构 中 。 因 而 相关 数组 中 的 每 一 个 元 
素 实 际 上 就 是 由 一 个 关键 码 以 及 一 个 值 组 成 的 一 对 实体 。 我 们 使 用 Perl 语 言 中 的 相关 数组 设计 
来 介绍 这 种 数据 结构 。Python 和 Ruby 以 及 Java、C++ 和 C# 的 标准 类 库 都 直接 支持 相关 数组 。 
相关 数组 所 特有 的 唯一 的 设计 问题 是 对 数组 中 元 素 的 引用 形式 。 


6.6.1 结构 与 操作 


在 Perl 语 言 中 ， 常 常 将 相关 数组 称 为 散 列 (hash)， 因 为 在 实现 中 是 通过 散 列 函数 来 存储 和 
检索 相关 数组 中 的 元 素 的 。Perl 中 不 同 散 列 的 名 字 空 间 是 不 同 的， 每 一 个 散 列 变量 都 必须 以 一 
个 百 分 号 (%) 开始 。 可 以 使 用 赋值 语句 将 散 列 设 为 字面 常量 值 ， 如 下 面 的 例子 ; 


salaries = ("Gary" => 75000, "Perry" => 57000, 
"Mary" => 55750, "Cedric" => 47850); 


Perl 使 用 一 种 独特 的 标记 方法 来 引用 单个 元 素 的 值 。 将 关键 码 放置 于 花 括号 之 内 ， 并 使 用 
标量 变量 的 名 字 来 替代 散 列 名 ， 而 这 个 替代 的 名 字 除 了 第 一 个 字符 以 外 都 是 相同 的 。 正 如 Perl 
数组 的 例子 ， 尽 管 散 列 不 是 标量 ， 但 是 散 列 元 素 的 值 部 分 是 标量 ， 所 以 对 散 列 元 素 值 的 引用 使 
用 标量 名 。 标 量变 量 开始 于 $ 符 号 。 例 如 ， 


$salaries{"Perry"} = 58850; 


通过 使 用 同样 的 句 型 可 以 添加 一 个 新 的 元 素 。 还 可 以 使 用 delete 操 作 符 从 散 列 中 删除 一 
个 元 素 ， 例 如 ， 

delete Ssalaries{"Gary"}; 

通过 将 空 的 字面 常量 赋 给 散 列 ， 可 以 使 得 整个 散 列 变 为 空 ， 例 如 ， 

@salaries = (); 

Per 中 散 列 的 大 小 是 动态 的 : 当 增加 一 个 新 的 元 素 时 散 列 即 会 长 大 ， 当 删 除 掉 一 个 元 素 时 
刻 列 会 缩小 ， 当 赋 以 散 列 空 的 字面 常量 时 可 以 将 它 清空 。 exists 操 作 符 将 返回 一 个 真 值 或 一 
个 假 值 ， 取 决 于 其 操作 数 关键 码 是 否 是 散 列 中 的 一 个 元 素 。 例 如 ， 


if (exists $salaries{"Shelly"}) ... 


当 将 操作 符 keys 运 用 于 一 个 散 列 时 ， 它 将 返回 散 列 的 一 个 关键 码 数组 。 而 操作 符 values 
将 返回 散 列 的 值 的 数组 。 操 作 符 each 将 遍历 散 列 的 每 一 个 元 素 对 。 
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PHE 语 言 中 的 数组 既是 正常 数组 又 是 相关 数组 。 可 以 将 这 些 数组 处 理 为 任意 的 一 种 。PHP 
语言 提供 了 对 元 素 进行 索引 式 存 取 和 散 列 式 存 取 的 函数 。 该 语言 中 的 数组 可 以 同时 包含 由 简单 
数值 索引 所 提供 的 元 素 ， 以 及 由 字符 串 散 列 关键 码 所 提供 的 元 素 。 

如 用 要 求 进行 元 素 搜寻 ， 散 列 比 数组 优越 得 多 ， 因 为 用 来 存 取 散 列 元 素 的 隐 式 散 列 操作 具 
有 非常 高 的 效率 。 而 且 ， 当 数据 是 成 对 存储 时 ， 散 列 是 完美 的 ， 如 职工 名 字 和 他 们 的 薪水 。 另 
一 方面 ， 如 果 必 须 处 理 一 个 表 列 中 的 每 一 个 元 素 ， 则 使 用 数组 会 有 更 高 的 效率 。 


开放 源 代码 运动 以 及 工作 经 历 


RASMUS LERDORF 

Rasmus Lerdorf 在 获取 了 工程 学 士 学 位 以 后 ， 先 后 从 事 了 几 项 咨询 工作 。 后 
来 ， 为 了 追踪 那些 上 网 阅读 他 个 人 简历 的 人 员 ， 他 创建 了 PHP 语 言 的 最 初版 本 。 
现在 ,他 是 开放 源 代码 运动 的 倡导 者 ， 同 时 也 受 雇 于 美国 加 州 Sunnyvale 的 Yahoo 
公司 。 

门 :关于 开放 源 代码 界 与 商业 软件 界 ， 你 有 一 些 什么 想法 ? 考虑 一 下 你 的 用 于 数据 库 与 网 页 连接 的 
PHP 语言 的 解决 办 法 ， 以 及 那些 商业 软件 界 的 软件 ，ASP、Cold Fusion, 等 等 。 对 比 由 开放 源 代码 方式 所 
丫 生 的 技术 与 商界 所 倡导 技术 ， 你 从 其 中 的 一 种 方式 里 将 会 得 到 什么 ? 从 另 一 种 方式 里 将 不 会 得 到 什么 ? 

E: 无 论 你 使 用 的 是 哪 一 种 商业 化 的 技术 ， 你 总 会 不 得 不 担心 ， 你 将 完全 依存 于 这 个 特定 的 商务 公 
司 。 你 没有 多 少 自主 权 来 决定 将 哪 一 些 特性 放 入 语言 的 下 一 个 版 本 ， 其 至 有 时 也 不 能 够 确定 还 会 不 会 有 洗 
襄 的 下 一 个 版 本 。 这 些 公司 也 往往 试图 将 你 完全 绑 在 他 们 的 技术 之 上 ， 剥 夺 你 改换 技术 的 灵活 性 ， 或 者 是 
忆 另 一 种 技术 相 结 合 的 容易 程度 。 当 然 商业 产品 至 少 有 一 个 明显 的 好 处 ， 就 是 你 可 以 买 到 有 保证 的 技术 去 
持 ， 这 样 ， 当 你 遇 到 困难 时 ， 有 人 在 电话 的 那 头 帮助 你 。 

在 开放 源 代码 的 世界 里 ， 至 少 就 PHP 而 言 ， 重 点 是 放 在 集体 之 上 。 我 个 人 并 没有 写 出 PHP 语 言 ， 而 是 
有 儿 百 人 编号 了 它 。 我 们 形成 了 一 个 大 集体 ， 我 们 中 的 每 一 人 都 共同 面 对 着 同一 个 问题 。 我 们 创造 了 一 种 
玫 助 我 们 解决 这 个 问题 的 工具 ， 并 且 我 们 都 有 对 于 这 种 工具 的 主人 公 意 识 。 这 就 是 为 什么 你 在 开放 源 代码 
世界 中 ， 常 常会 看 到 人 们 对 于 某 种 技术 问题 的 热情 投入 ， 这 种 投入 在 商业 软件 界 是 非常 罕见 的 。 人 们 加 入 
到 这 个 集体 中 十 分 容易 ， 并 且 在 PHP 语 言 开 发 方面 给 予 了 哪怕 是 十 分 微小 的 帮助 。 参 与 这 些 工作 的 人 们 将 
获得 对 于 这 种 技术 的 较为 深刻 的 感受 。 他 们 将 满怀 信心 地 认为 ， 这 种 技术 不 会 在 他 们 这 里 消亡 ， 将 会 帮助 
他 们 解决 他 们 当前 的 问题 ， 很 有 可 能 还 会 帮助 他 们 解决 将 来 的 一 些 问 题 。 通 过 这 个 集体 ， 他 们 能 够 获得 所 
需要 的 技术 支持 。 

设 杰 一 种 情景 ， 你 走 进 商店 去 购买 一 个 盒 装 的 软件 ， 希 望 它 的 技术 能 够 解决 你 的 大 部 分 问题 ， 再 设 
起 另 一 种 情景 ， 你 与 一 千 多 位 有 着 同样 问题 的 好 朋友 坐 在 一 起 ， 比 较 各 自 的 工作 笔记 和 各 自 的 工具 ， 商 务 
的 办 法 在 某 些 时 候 可 能 是 一 种 较 好 的 解决 办 法 ， 但 是 那个 强大 的 团体 阵容 围绕 着 开放 源 代 码 的 项 目 不 惜 代 
价 地 建设 自身 ， 却 是 一 种 多 么 吸引 人 的 方式 ! 商务 公司 也 试图 围绕 着 他 们 的 办 法 来 建立 一 些 这 样 的 团体 
有 时 候 他 们 也 非常 成 功 ,但 终究 ， 这 里 的 气氛 与 一 个 健康 的 开放 源 代码 的 团体 是 完全 不 相同 的 ， 你 简直 不 
能 够 将 这 两 者 进行 比较 。 当 开放 源 代码 团体 所 建设 的 工具 成 熟 以 后 ， 这 些 工具 就 开始 与 任何 已 有 的 商业 化 
工具 相 苑 争 ， 或 者 是 超过 它们 。 对 于 PHP 语 言 ， 我 们 实际 上 已 经 超过 了 ASP 以 及 Cold Fusion。 在 最 初 的 阶 
段 ， 我 们 并 没有 真正 去 追赶 任何 特定 的 商业 化 工具 ， 我 们 仅仅 是 试图 找到 解决 网 络 问题 的 办 法 

Fl: 你 能 否 让 我 们 分 享 你 的 一 些 想法 ， 关 于 在 1995 年 你 独自 为 你 的 个 人 网 页 开发 解决 办 法 ， 以 及 你 
让 所 谓 的 分 散 团队 来 接受 你 的 原始 想法 ， 进 而 将 这 些 想法 实现 为 被 成 百 万 的 网 站 使 用 的 工具 。 

E: 当时 ， 我 是 想 从 重复 编写 C 语 言 的 通用 网 关 接 口 (CGI) 的 工作 中 解脱 出 来 。 我 将 一 些 通用 的 功 
能 程序 收集 到 一 个 C 程 序 库 中 ， 并 为 这 个 库 建立 一 个 简单 的 语法 分 析 器 ， 以 便 我 可 以 在 我 的 HTML 文 件 中 
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放 上 一 些 特别 的 标记 ， 来 启动 我 用 C 编 写 的 各 种 子 程序 ， 这 种 方式 在 当时 似乎 是 一 种 显然 的 解决 办 法 。 因 
而 在 早期 我 最 主要 的 要 求 是 开发 的 速度 以 及 动态 网 页 的 使 用 ， 还 有 就 是 获取 我 所 需要 的 一 种 简单 框架 : 用 
C 来 编写 业务 逻辑 ， 再 从 HTML 文 件 中 访问 调用 这 些 逻 辑 程 序 。 

在 任何 人 开始 注意 之 前 ， 我 很 可 能 已 经 在 初始 代码 上 耗费 了 大 约 18 个 月 的 时 间 。 当 时 大 约 是 1994 年 ， 
这 远 早 于 任何 围绕 着 开放 源 代码 或 免费 软件 开发 的 争议 开始 之 前 。 我 个 人 还 是 认为 当时 进入 的 门槛 较 现在 
低 。 当 时 还 没有 多 少 针 对 网 络 问题 的 免费 工具 。 但 我 还 是 必须 将 PHP 开 发 到 一 定 的 程度 以 引起 人 们 的 关注 ， 
让 人 们 觉得 PHP 可 以 解决 他 们 很 多 的 问题 ， 而 且 很 容易 使 用 ， 也 许 只 需要 稍 做 扩展 就 能 够 解决 他 们 的 问题 ， 
他 们 不 需要 完全 从 零 开始 。 这 就 是 任何 一 个 成 功 的 开放 源 代码 项 目 在 其 进程 中 的 茶 一 个 时 刻 所 必须 跨越 的 
门 榄 。 使 用 其 他 人 的 解决 办 法 ， 理 解 它 ， 并 将 它 实 施 于 你 自己 的 问题 之 上 ， 这 是 你 在 时 间 与 精力 上 的 一 项 
大 投资 ， 况 且 你 还 不 能 够 肯定 这 种 方法 是 否 适用 。 在 一 个 开放 源 代码 项 目 被 证 明 是 适用 之 前 ， 跨 越 这 个 门 
槛 是 十 分 艰巨 的 一 步 ， 如 果 你 询问 任何 曾经 成 功 开创 过 开放 源 代码 项 目的 人 士 ， 你 多 半 会 发 现 ， 在 他 们 生 
命中 的 这 一 个 阶段 , 他 们 曾经 为 此 完全 贡献 出 了 他 们 业余 时 间 的 每 分 每 秒 。 这 正 是 我 在 1994 年 到 1995 年 间 ， 
为 了 PHP 语 言 所 经 历 的 真实 的 生活 状态 。 

Al: 你 还 记得 你 第 一 次 接受 到 的 来 自 其 他 人 对 于 语言 的 扩展 吗 ? 当时 的 需求 是 什么 ? 

答 : 我 曾经 接受 到 几 次 改 错 ， 但 在 早期 第 一 次 接受 到 的 大 的 贡献 是 为 连接 Sybase 和 Oracle 数 据 库 所 作 
的 扩展 。 我 曾经 编写 了 连接 数据 库 的 代码 ， 用 以 连接 一 个 来 自 澳大利亚 的 名 称 为 mSQL 的 免费 数据 库 。 我 
当时 没有 使 用 Sybase 或 Oracle 数 据 库 ， 但 是 其 他 地 方 的 一 些 人 却 需要 与 这 些 数据 库 进 行 交 互 ， 因 而 他 们 编 
写 了 代码 ， 并 将 这 些 代 码 贡 献 了 出 来 。 

lA): 能 否 与 我 们 分 享 一 下 ， 当 你 最 初 公布 PHP 时 ， 它 是 什么 样子 ? 以 及 它 能 够 进行 什么 样 的 工作 ? 

答 : 当时 它 只 是 一 组 联系 松散 的 CGI 程 序 ， 用 于 解决 个 人 网 页 上 的 一 般 问题 。 它 具有 一 个 点 击 计数 器 ， 
这 个 计数 器 同时 也 显示 最 后 一 个 浏览 网 页 的 人 的 IP 地 址 ， 以 及 机 器 在 网 络 上 的 名 称 。 它 还 能 将 点 击 记 录 到 
一 个 SQL 数据 库 中 ， 还 包括 产生 有 关 网 页 访问 报告 的 工具 。 因 而 早期 的 注意 力 是 放 在 这 些 工 具 之 上 ， 而 并 
没有 放 在 编写 这 些 工具 的 语言 与 框架 之 上 。 

lal: 开放 源 代 码 运动 有 些 什 么 贡献 ?对比 过 去 ,今天 的 PHP 语 言 又 是 什么 样子 ? 

Z: 开放 源 代码 运动 的 集体 对 PHP 语 言 贡献 了 所 有 一 切 。 没 有 这 个 集体 ， 就 不 会 有 PHP 语 言 。PHP 已 
经 成 长 为 一 种 一 般 用 途 的 网 络 脚 本 语言 ， 这 种 语言 可 以 对 你 可 以 想象 的 任何 对 象 进行 交流 ， 并 且 已 经 被 用 
于 30% 的 网 络 服务 器 上 。 它 现在 的 支持 范围 从 最 小 的 家 庭 网 页 (可 能 每 个 月 只 有 两 次 点 击 ) 到 世界 上 最 繁 
忙 的 网 站 。 

在 IT 商务 中 的 经 历 及 工作 岁月 

A): 你 曾经 有 过 各 种 职业 ， 从 大 公司 到 网 站 ， 再 到 个 人 的 咨询 工作 : 你 怎样 决定 下 一 步 应 该 做 什么 ? 

A: 我 期 望 有 意思 且 具 有 挑战 的 项 目 ， 也 希望 能 够 与 相处 愉快 、 融 洽 的 人 一 道 工 作 。 但 有 时 候 也 只 
好 磁 碰 运气 。 我 当年 去 巴西 ， 最 初 仅 是 因为 我 在 加 拿 大 的 Calgary 工 作 时 正 是 冬天 ， 那 里 实在 是 太 冷 了 。 
我 刚好 看 了 一 些 Mickey Rourke 在 Rio 拍 摄 的 电影 ， 就 开始 想 自己 干 嘛 要 待 在 这 冰冻 极地 ， 而 巴西 肯定 也 有 
计算 机 ， 肯 定 也 需要 程序 人 员 。 

问 : 你 是 怎么 决定 在 什么 时 候选 择 辞 职 ? 

答 : 当 工 作 不 再 有 意思 时 ， 我 就 会 辞职 。 如 果 我 每 天 早上 醒 来 都 惧怕 出 去 工作 ， 或 者 我 每 天 坐 在 那 
里 都 时 刻 在 看 钟 ， 想 着 是 否 已 经 到 了 应 该 回 家 的 时 间 ， 这 时 ， 我 就 知道 我 应 该 辞职 了 。 总 会 有 那么 一 段 时 
间 ， 你 会 不 想 去 工作 而 想 去 别 的 地 方 ， 但 是 如 果 这 种 感觉 是 持续 的 ， 那 么 你 的 短暂 的 生命 是 不 值得 耗费 在 
诅 起 与 无 聊 之 中 的 。 如 果 你 甚至 发 现 自己 在 计算 每 一 秒 钟 挣 多 少 钱 ， 或 者 是 计算 在 你 去 厕所 来 回 时 ， 你 的 
公司 付 了 你 多 少 钱 ， 那 么 就 该 辞职 ! | 

问 : 你 在 选择 下 一 个 任务 时 ， 有 没有 一 些 标准 或 者 规则 ? 

E: 没有 。 我 经 党 是 跳 来 跳 去 ， 但 我 从 来 没有 任何 一 些 所 谓 预先 的 计划 ， 要 在 一 个 公司 待 X 个 月 或 者 
一 年 。 常 常 是 工作 的 本 身 来 决定 我 应 该 待 多 久 。 我 从 事 某 一 些 工作 ， 纯 粹 是 为 了 解决 某 一 个 特定 的 问题 。 
在 解决 了 这 个 问题 之 后 ， 他 们 多 半 希 望 我 继续 待 在 那里 ， 帮 助 他 们 维护 和 支持 这 种 解决 办 法 ， 但 到 那 时 ， 
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挑战 性 的 工作 已 经 没有 了 ， 我 又 需要 新 的 东西 。 当 然 ， 现 在 我 有 一 个 小 baby 在 家 里 ， 这 可 能 稍稍 改变 了 我 
作 选 择 的 优先 级 别 。 也 许 ， 一 个 没有 压力 同时 又 具有 挑战 性 的 舒服 工作 是 一 个 好 主意 。 我 会 在 两 年 以 后 再 
告诉 你 。 





6.6.2 实现 相关 数组 


为 了 快速 查询 ， 在 Perl 的 相关 数组 实现 中 施行 了 优化 。 当 由 于 数组 的 增长 而 带 来 需求 时 ， 
它 也 提供 了 相对 快 的 重新 组 织 数组 的 功能 。 虽 然 相关 数组 在 初始 时 只 使 用 很 小 部 分 的 散 列 值 ， 
对 每 一 个 散 列 项 都 计算 了 一 个 32 字 位 的 散 列 值 ， 并 将 这 个 散 列 值 与 散 列 项 储存 在 一 起 ， 但 当 一 
个 相关 数组 必须 被 扩展 ， 超 过 它 的 初始 大 小 时 ， 这 并 不 需要 改变 散 列 函数 ， 而 只 需 使 用 更 多 的 
字 位 散 列 值 。 当 发 生 这 种 情形 时 ， 仅 需要 挪动 一 半数 目的 散 列 项 。 因 而 ， 尽 管 相关 数组 的 扩展 
是 有 代价 的 ， 但 是 它 并 不 是 你 所 想象 的 那么 昂贵 。 

PHP 中 数组 的 元 素 被 储存 于 一 种 链表 形式 中 ， 其 中 的 节点 顺序 就 是 产生 这 些 节点 的 顺序 。 

通过 current 以 及 next 国 数 ， 这 个 链 支持 数组 元 素 的 遍历 访问 。 散 列 函 数 则 被 用 于 通过 
关键 码 存 取 数 组 中 的 所 有 元 素 。 


6.7 记录 类 型 


记录 是 一 些 不 同类 型 的 数据 元 素 的 聚集 ， 其 中 的 单个 元 素 是 通过 名 字 来 标识 。 

在 程序 中 ， 常 常 需要 模拟 不 同类 型 的 数据 集合 。 例 如 ， 一 个 关于 大 学 生 的 信息 可 能 包括 姓 
名 、 学 号 、 平 均 分 数 ， 等 等 。 为 这 样 的 一 种 集合 设计 的 数据 类 型 可 能 会 使 用 字符 串 来 存放 姓名 ， 
使 用 整数 来 存放 学 号 ， 使 用 浮 点 数 来 存放 平均 分 数 ， 等 等 。 记 录 就 正 是 为 了 满足 这 一 需求 而 设 
计 的 。 

目 20 世 纪 60 年 代 早期 COBOL 语 言 引入 记录 以 来 ， 记 录 类 型 已 经 成 为 所 有 最 流行 的 程序 设计 
语言 中 的 组 成 部 分 ， 除 了 Pre-90 以 前 的 Fortran 语 言 版 本 。 

在 C，C++ 以 及 C# 语 言 中 ， 是 通过 使 用 struct 数 据 结构 来 支持 记录 。 在 C++ 中 ， 结 构 只 是 
类 的 少许 变 体 。 在 C# 中 ， 结 构 也 与 类 相似 ， 但 又 具有 显著 的 差别 。C# 中 的 结构 正好 与 类 中 的 对 
象 相反 ， 它 们 是 一 些 在 栈 上 分 配 的 值 类 型 ， 而 类 中 的 对 象 则 是 一 些 在 堆 上 分 配 的 引用 类 型 。 
C++ 以 及 C# 中 的 结构 通常 被 用 作 封包 结构 ， 而 不 是 被 用 作 数 据 结 构 。 关 于 这 些 结构 功能 的 进 一 
步 讨 论 请 见 第 11 章 。 

Python 和 Ruby 的 记录 能 用 散 列 来 实现 ， 散 列 可 以 是 数组 元 素 。 

在 下 面 的 儿 节 ， 我 们 将 描述 如 何 声 明 或 定义 记录 ， 怎 样 引用 记录 中 的 域 ， 以 及 一 些 常 用 的 
记录 操作 。 

记录 所 特有 的 设计 问题 是 : 

。 域 的 引用 的 语法 形式 是 什么 ? 

* 在 记录 中 人 允许 省 略 引 用 吗 ? 

6.7.1 记录 的 定义 

记录 与 数组 之 间 的 根本 不 同 在 于 : 数组 中 元 素 具 有 同 构 性 ， 而 记录 中 元 素 可 能 具有 异 构 性 。 

这 个 区 别 的 结果 之 一 是 ， 记 录 中 的 元 素 或 域 通 常 不 是 由 下 标 来 引用 。 反 之 ， 域 是 由 标识 符 来 命 


名 ， 并 使 用 这 些 标 识 符 进行 域 的 引用 。 记 录 与 数组 之 间 的 一 种 更 为 重要 的 差别 是 ， 革 些 语言 中 
的 记录 允许 包括 联合 ， 我 们 将 在 第 6.8 节 中 讨论 这 个 问题 。 
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记录 声明 的 COBOL 形式 是 COBOL 程 序数 据 段 中 的 部 分 ， 下 面 给 出 一 个 例子 : 
01 EMPLOYEE-RECORD. 
02 EMPLOYEE-NAME. 
05 FIRST PICTURE IS X(20). 
05 MIDDLE PICTURE IS X(10). 
05 LAST PICTURE IS X(20). 
02 HOURLY-RATE PICTURE IS 99V99. 
记录 EMPLOYEE-RECORD 包 括 记 录 EMPLOYEE-NAME 和 域 HOURLY-RRTE。 每 一 行 记 录 声 明 
开头 的 数字 01、02 和 05 为 层 号 ， 它 们 的 相对 值 指示 了 记录 的 层次 结构 。 如 果 一 个 行 的 后 面 跟 
随 了 一 个 较 高 层 号 的 行 ， 这 个 行 的 本 身 就 是 一 个 记录 。PICTURE 子 句 表 示 域 的 存储 地 址 格式 ， 
X(20) 表 明 20 个 字母 数字 字符 ， 而 99V99 表 明 4 个 十 进 制 的 数字 ， 小 数 点 就 位 于 中 间 。 
Ada 对 于 记录 使 用 了 不 同 的 语法 ， 它 不 使 用 COBOL 语 言 的 层 号 ， 它 通过 将 一 个 记录 声明 租 
套 于 另 一 个 记录 声明 ， 来 说 明 记 录 的 结构 。Ada 中 的 记录 不 能 够 是 匿名 的 ， 它 们 必须 为 命名 类 
型 。 考 虑 下 面 的 Ada 声 明 : 


type Employee Name Type is record 
First, § String (1.<20)? 
Middle : String (1..10); 
Last : String (1:20): 
end record; 
type Employee Record Type is record 
Employee Name: Employee Name Type; 
Hourly Rate: Float; 
end record; 
Employee Record: Employee Record Type; 
Fortran 95 Aide AA BCR fa RICE MAR. AAT LAD Ride H+, 
就 需要 先 定义 座 员 名 字 记 录 ， 然 后 ， 座 员 记 录 仅 仅 将 它 命名 为 雇员 记录 的 第 一 个 域 的 类 型 。 
在 Java 中 ， 可 以 将 记录 定义 为 数据 类 ， 而 将 和 藤 套 的 记录 定义 为 嵌 套 的 类 。 这 种 类 中 的 数据 
成 员 则 被 用 作 记 录 中 的 域 。 


6.7.2 记录 域 引 用 


对 记录 中 各 个 域 的 引用 ， 在 语法 上 可 用 几 种 不 同 的 方法 来 说 明 ， 其 中 的 两 种 方法 要 命名 所 
需要 的 域 和 包含 它 的 记录 。COBOL 中 的 域 引用 具有 下 面 的 形式 ; 

it 4% OF wk f% 1 OF ... OF ER An 

其 间 的 第 一 个 记录 名 是 包含 了 这 个 域 的 最 小 或 最 里 面 的 记录 。 在 序列 中 的 下 一 个 记录 名 是 
包含 了 前 面 的 记录 的 记录 ， 并 依 此 类 推 。 例 如 ， 在 前 面 COBOL 记 录 例 子 中 的 MIDDLE 域 就 可 以 
采用 下 面 的 形式 来 引用 : 

MIDDLE OF EMPLOYEE-NAME OF EMPLOYEE-RECORD 

大 多 数 的 其 他 语言 采用 点 标记 方式 来 进行 域 的 引用 ， 其 中 被 引用 的 部 分 由 点 (句号 ) 连接 
起 来 ， 而 在 点 标记 法 中 名 字 的 排列 顺序 则 正好 与 COBOL 中 的 引用 顺序 相反 : 它们 首先 使 用 最 大 
包含 的 记录 名 ， 最 后 才 使 用 域名 。 例 如 ， 下 面 是 对 于 上 述 Ada 记 录 例 子 中 的 Middle 域 的 引用 : 


Employee Record.Employee Name.Middle 


C 和 C++ 使 用 同样 的 语法 执行 对 其 结构 成 员 的 引用 。Fortran 95 中 的 域 引 用 也 具有 这 种 形式 ， 
只 是 它 使 用 的 是 百 分 号 (%) 而 不 是 点 (句号 )。 
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对 一 个 记录 域 的 完全 限定 引用 ， 是 指引 用 中 必须 出 现 所 有 的 中 间 记 录 的 名 称 ， 从 最 大 包 合 
的 记录 直到 特定 的 域 。 上 面 例 子 中 的 COBOL 和 Ada 的 域 引用 都 是 完全 限定 的 。 作 为 对 完全 限定 
引用 的 一 种 替代 ，COBOL 语 言 还 允许 对 记录 中 域 的 省 略 引 用 。 在 省 略 引 用 中 必须 要 有 域名 ， 但 
却 可 以 省 略 任何 部 分 或 者 全 部 的 包含 记录 名 ， 只 要 所 产生 的 引用 在 引用 环境 中 是 非 歧 义 的 。 例 
t, FIRST, FIRST. OF EMPLOYEE-NAMEL) MFIRST OF EMPLOYEE-RECORD, 在 上 面 声 
明 的 COBOL 的 记录 中 是 对 于 雇员 名 的 省 略 引 用 。 虽 然 省 略 引 用 给 程序 人 员 带 来 了 方便 ， 但 是 它 
们 要 求 编译 器 具有 精细 的 数据 结构 以 及 处 理 过 程 ， 以 便 正 确 地 识别 所 引用 的 域 。 它 们 在 某 种 程 
度 上 也 会 有 损 于 可 读 性 。 


6.7.3 记录 操作 


赋值 是 一 种 常用 的 记录 操作 。 在 大 部 分 情况 下 ， 等 号 两 边 的 类 型 必须 相同 。Ada 人 允许 对 记 
录 进 行 等 于 和 不 等 于 两 种 比较 。 另 外 ，Ada 中 的 记录 还 可 以 使 用 字面 常量 的 聚集 来 设置 急 值 。 

COBOL 提 供 了 MOVE CORRESPONDING 语 句 来 移动 记录 。 这 条 语句 将 给 定 的 源 记 录 中 的 域 
复制 到 目的 记录 中 ， 但 是 只 有 当 这 个 目的 记录 具有 一 个 相同 名 字 的 域 时 ， 才 能 够 进行 这 种 复制 。 
在 数据 处 理应 用 中 ， 这 常常 是 一 种 十 分 有 用 的 操作 ， 可 以 将 其 中 的 输入 记录 在 经 过 一 些 修改 之 
后 移 到 输出 文件 中 。 因 为 输入 记录 和 常常 具有 许多 的 域 ， 这 些 域 与 输出 记录 中 的 域 同 名 以 及 同 目 
的 ， 但 却 不 一 定 具 有 相同 的 次 序 ，MOVE CORRESPONDING 操 作 能 够 万 省 许多 语句 。 例 如 ， 考 


虑 下 面 的 COBOL 结构 : 
01 INPUT-RECORD. 
02 NAME. 
05 LAST PICTURE IS X(20). 
05 MIDDLE PICTURE IS X(15). 
05 FIRST PICTURE IS X(20). 
02 EMPLOYEE-NUMBER PICTURE IS 9(10). 
02 HOURS-—-WORKED PICTURE IS 99. 
01 OUTPUT-RECORD. 
02 NAME. 
05 FIRST PICTURE IS X(20). 
05 MIDDLE PICTURE IS X(15). 
05 LAST PICTURE IS X(20). 
02 EMPLOYEE-NUMBER PICTURE IS 9(10). 
02 GROSS-—PAY PICTURE IS 999V99. 
02 NET-PAY PICTURE IS 999V99. 
语句 


MOVE CORRESPONDING INPUT-RECORD TO OUTPUT-RECORD. 


将 域 FIRST、MIDDLE、LRAST 以 及 EMPLOYEE-NUMBER 和 复制 到 输出 记录 中 。 


6.7.4 评估 


在 程序 设计 语言 中 ， 记 录 通 常 是 十 分 有 价值 的 数据 类 型 。 记 录 类 型 的 设计 是 简单 的 ， 使 用 
也 很 安全 。 记 录 在 可 读 性 方面 唯一 不 清晰 之 处 ， 是 在 COBOL 语 言 中 允许 的 省 略 引 用 。 

记录 与 数组 是 紧密 相关 的 结构 形式 ， 因 而 将 记录 与 数组 进行 一 些 比 较 是 十 分 有 意义 的 事 
情 。 如 果 所 有 的 数据 值 都 具有 相同 的 类 型 ， 并 且 以 相同 的 方式 处 理 时 ， 就 采用 数组 。 当 整个 
结构 是 一 系列 的 同 构 元 素 时 ， 数 据 处 理 就 很 容 多 完成 。 动 态 下 标 寻 址 方法 很 好 地 支持 了 这 种 
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而 如 果 这 组 数据 值 为 不 同类 型 ， 并 且 对 不 同 域 要 使 用 不 同 的 方式 来 处 理 时 ， 就 采用 记录 。 
另外 ， 记 录 的 域 通常 也 不 需要 按 某 种 特定 的 顺序 来 处 理 。 域 名 类 似 于 字面 常量 、 党 量 或 者 下 标 。 
因为 域名 是 静态 的 ， 所 以 它们 对 域 提供 了 非常 高 效 的 存 取 。 也 可 以 使 用 动态 下 标 来 进行 记录 域 
的 存 取 ， 但 那样 将 不 允许 类 型 的 检测 ， 并 且 速 度 也 会 比较 慢 。 

记录 与 数组 为 满足 两 种 不 同 但 又 相关 的 数据 结构 的 有 关 应 用 提供 了 周全 及 高 效率 的 方法 。 


6.7.5 记录 类 型 的 实现 


记录 的 域 被 储存 于 相 邻 的 存储 单位 中 。 但 是 因为 域 的 大 
小 不 一 定 相 同 ， 所 以 数组 使 用 的 存 取 方 法 就 不 适用 于 记录 。 域 1 
相对 于 记录 开始 位 置 的 偏 移 地 址 与 每 一 个 域 相关 联 ， 因 此 域 
的 存 取 完全 是 使 用 这 些 偏 移 地 址 来 进行 的 。 记 录 的 编译 时 描 
述 符 具有 图 6-8 中 所 示 的 一 般 形 式 。 记 录 的 运行 时 描述 符 则 是 
不 必要 的 。 


6.8 联合 类 型 


合 是 一 种 类 型 ， 在 程序 的 执行 期 间 ， 这 种 类 型 可 能 在 不 
同 的 时 刻 储存 不 同类 型 的 值 。 作 为 联合 类 型 应 用 的 一 个 例子 ， 
我 们 来 考虑 编译 器 的 一 个 常量 表 ， 这 个 表 被 用 来 储存 从 正在 编 
译 的 程序 里 发 现 的 常量 。 每 一 个 表 项 的 域 存放 一 个 常量 值 。 假 设 对 于 正在 编译 的 某 种 语言 ， 它 
的 常量 的 类 型 为 整 型 、 浮 点 型 和 布尔 型 ， 就 表 的 管理 而 言 ， 如 果 在 相同 的 位 置 上 ， 即 表 中 的 一 
个 域 里 ， 可 以 储存 这 三 种 类 型 中 的 任何 一 种 类 型 的 值 ， 将 会 是 很 方便 的 。 这 样 ， 可 以 使 用 同样 
的 方法 对 所 有 的 常量 值 寻 址 。 在 某 种 意义 上 ， 这 样 一 种 位 置 的 类 型 是 它 所 能 够 储存 的 三 种 值 的 
类 型 的 联合 。 
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图 6-8 记录 的 编译 时 描述 符 


6.8.1 设计 问题 


在 第 5 章 曾 经 讨论 过 联合 类 型 的 类 型 检测 问题 ， 引 出 了 一 个 重要 的 设计 问题 。 另 一 个 基本 问 
题 是 怎样 从 语法 上 表示 联合 。 在 某 些 情形 下 ， 联 合 被 限制 为 记录 结构 的 组 成 部 分 ， 但 是 在 另 一 
些 情形 下 ， 它 们 却 不 是 。 因 而 联合 类 型 所 特有 的 基本 设计 问题 如 下 : 

* 对 联合 类 型 应 该 要 求 类 型 检测 吗 ? 请 注意 ， 任 何 对 联合 类 型 的 类 型 检测 都 必须 是 动态 的 。 

* 应 该 将 联合 类 型 俱 入 到 记录 中 吗 ? 


6.8.2 判别 的 联合 与 自由 联合 


Fortran、C 和 C++ 语言 都 提供 了 联合 结构 ， 但 是 都 没有 被 语言 支持 的 类 型 检测 。 在 Fortran 
中 ， 是 使 用 Equivalence 语 句 来 说 明 联 合 ， 在 C 和 C++ 中 ， 则 是 使 用 union 结 构 。 因 为 允许 
程序 人 员 在 使 用 联合 时 有 不 进行 类 型 检测 的 自由 ， 所 以 将 这 些 语言 中 的 联合 称 为 自由 联合 。 
例如 ， 考 虑 下 面 的 C 联 合 : 


union flexType { 
int intEl; 
float floatEl; 
union flexType ell; 
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float x ; 


eli.dntEl = 273 

x = ell.floatEl; 

这 最 后 的 赋值 不 是 类 型 检查 的 ， 因 为 系统 不 确定 eL1 当 前 值 的 当前 类 型 ， 所 以 它 把 27 的 
位 字符 串 表 示 赋 给 float 变量 x。 当 然 ， 这 是 没有 意义 的 。 

对 于 联合 的 类 型 检测 ， 要 求 每 一 个 联合 结构 包括 一 个 类 型 指示 符 。 这 种 指示 符 被 称 为 标志 
(tag) 或 者 判别 式 (discriminant) ， 一 个 具有 判别 式 的 联合 就 被 称 为 判别 的 联合 (discriminated 
union) 。 第 一 种 提供 了 判别 联合 的 语言 是 ALGOL 68。Ada 语 言 现在 也 支持 判别 的 联合 。 


6.8.3 _ Ada 联合 类 型 


Ada 在 前 辈 语 言 Pascal 的 基础 上 对 判别 的 联合 做 出 的 设计 是 允许 用 户 指明 一 个 变 体 记 录 类 型 
的 变量 ， 这 种 变 体 记录 类 型 将 仅仅 储存 变 体 中 的 一 个 可 能 值 。 用 户 可 以 通过 这 种 方式 来 告诉 系 
统 ， 类 型 检测 在 什么 时 候 可 以 为 静态 的 。 这 种 限制 了 的 变量 就 被 称 为 受 限 变 体 变量 。 

处 理 一 个 受 限 变 体 变量 的 标志 十 分 类 似 于 命名 常量 。 在 Ada 语 言 中 的 非 受 限 变 体 变量 允许 
变 体 的 值 在 执行 期 间 改变 类 型 。 然 而 要 改变 变 体 的 类 型 ， 就 只 能 够 通过 赋予 包括 判别 式 的 整个 
记录 。 这 样 就 杜绝 了 记录 的 不 一 致 性 ， 因 为 如 果 新 赋值 记录 是 常量 数据 的 聚集 ， 那 么 就 可 以 静 
态 地 检测 标志 值 以 及 变 体 类 型 的 一 致 性 。.。 如 果 所 赋 的 值 是 一 个 变量 ， 它 的 一 致 性 在 赋值 时 就 得 
到 了 保证 ， 因 而 这 个 变量 被 赋 的 新 值 肯 定 是 一 致 的 。 

下 面 的 例子 显示 了 一 个 Ada 变 体 记录 

type Shape is (Circle, Triangle, Rectangle); 

type Colors is (Red, Green, Blue); 

type Figure (Form : Shape) is 

record 
Filled : Boolean; 
Color :: Colors; 
case Form is 
when Circle => 
Diameter : Float; 
when Triangle => 
Left Side : Integer; 
Right Side : Integer; 
Angle : Float; 
when Rectangle => 
Side 1 : Integer; 
Side 2 : Integer; 
end case; 
end record; 


图 6-9 显 示 了 这 个 变 体 记录 的 结构 。 下 面 的 两 条 语句 声明 类 型 Figure 的 变量 : 


Figure 1 : Figure; 
Figure 2 : Figure(Form => Triangle); 


Figure_1 被 声明 为 不 具有 初始 值 的 非 受 限 变 体 变 量 。 它 的 类 型 改变 可 以 通过 赋 以 包括 判 
别 式 的 整个 记录 而 得 以 实现 ， 如 在 下 面 所 示 的 : 


日 ”此 处 的 一 致 性 是 指 : 如 果 标 签 显示 当前 的 联合 类 型 是 整 型 ， 那 么 联合 体 的 类 型 就 为 整 型 。 
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Figure 1 := (Filled => True, 
Color => Blue, 
Form => Rectangle, 
Side 1 => 12, 
Side 2 => 3); 


Rectangle: Side 1, Side 2 


Circe:Diameter 


hee Ses 


Triangle: Left_Side, Right Side, Ange 
LL Binnie: rent 
Color 


Filled 


图 6-9 三 种 形状 变量 的 判别 式 联合 (假设 所 有 变量 都 是 同样 大 小 的 ) 


这 一 条 赋值 语句 的 右边 是 一 个 数据 的 聚集 。 

而 变量 Figure_2 的 声明 则 将 其 限制 成 为 一 个 三 角形 ， 并 且 还 不 能 被 改变 为 另外 的 变 体 。 

这 种 判别 联合 的 形式 是 十 分 安全 的 ， 因 为 它 总 是 允许 类 型 检测 ， 虽 然 必须 动态 地 检测 受 限 
变 体 中 域 的 引用 。 例 如 ， 假 设 有 下 面 的 语句 


if(Figure_1.Diameter > 3.0) ... 


运行 时 系统 将 需要 检测 Figure_1 以 确定 其 Form 标 签 是否 为 Circle。 如 果 不 是 ， 引 用 
Diameter 将 产生 一 个 类 型 错误 。 


6.8.4 评估 


在 许多 语言 中 ， 联 合 是 潜在 的 非 安 全 结构 。 这 就 是 Fortran、C 以 及 C++ 不 是 强 类 型 语言 的 原 
因 之 一 : 因为 这 些 语言 不 允许 对 联合 的 引用 进行 类 型 检测 。 但 在 另 一 方面 ， 联 合 也 可 以 被 安全 
地 应 用 ， 就 如 同 在 Ada 中 那样 。 在 绝 大 多 数 的 语言 中 ， 在 使 用 联合 时 务必 十 分 小 心 。 

Java 和 C# 都 没有 包括 联合 ; 这 可 能 反映 出 对 于 程序 设计 语言 中 的 安全 问题 所 增加 的 关注 。 


6.8.5 联合 类 型 的 实现 


实现 判别 的 联合 可 以 仅 通过 对 每 一 个 可 能 的 变 体 都 使 用 相同 的 地 址 。 给 最 大 变 体 分 配 以 充 
足 的 存储 空间 。 至 于 Ada 语 言 中 的 受 限 变 体 的 情形 ， 因 为 不 存在 大 小 的 变化 ， 因 而 可 以 使 用 准 
确 大 小 的 存储 空间 。 判 别 的 联合 的 标志 与 变 体 一 起 被 储存 在 一 种 与 记录 相 类 似 的 结构 中 。 

在 编译 时 ， 必 须 将 每 一 个 变 体 的 完整 描述 储存 起 来 。 完 成 这 项 任务 的 方式 是 为 描述 符 中 的 
标志 项 建立 一 个 case 表 格 。 在 这 个 表格 中 ， 每 一 种 变 体 都 有 一 个 项 ， 这 个 项 指向 特定 变 体 的 描 
述 符 。 为 了 说 明 这 种 安排 ， 请 考虑 下 面 的 Ada 例 子 ; 

type Node (Tag : Boolean) is À 

record 
case Tag is 

when True => Count : Integer; 

when False => Sum : Float; 


end case; 
end record; 
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这 种 类 型 的 描述 符 可 以 具有 图 6-10 中 所 示 的 形式 。 


判别 的 联合 










图 6-10 判别 的 联合 的 编译 时 描述 符 
6.9 指针 类 型 与 引用 类 型 


指针 类 型 是 这 样 一 种 类 型 ， 这 种 类 型 的 变量 的 值 范 围 包括 了 存储 器 地 址 以 及 特殊 值 ail 
( 空 值 )。nil 并 不 是 一 个 有 效 地 址 ， 仅 使 用 它 来 表示 当前 的 指针 不 能 够 指向 任何 存储 单位 ， 

指针 是 为 两 种 不 同 的 用 途 而 设计 的 。 首 先 ， 指 针 提供 某 种 间接 寻 址 的 功能 ， 这 种 功能 被 
频 花 地 使 用 于 汇编 程序 设计 语言 中 。 其 次 ， 指 针 提供 了 管理 动态 存储 空间 的 一 种 方法 。 指 针 
可 以 被 用 来 访问 动态 分 配 的 存储 区 域 中 的 某 一 个 位 置 ， 这 种 动态 分 配 的 存储 区 域 通常 被 称 为 
HE (heap), 

其 存储 空间 是 从 堆 中 动态 分 配 的 变量 被 称 为 堆 动 态 变 (heap dynamic variable)。 通 常 没 
有 二 它们 相关 联 的 标识 符 ， 因 而 这 种 变量 的 引用 只 能 通过 指针 或 引用 类 型 的 变量 来 进行 。 没 有 
名 守 的 变量 被 称 为 匿名 变量 (anonymous variable)。 正 是 在 后 面 的 这 种 指针 的 应 用 领域 里 产生 
了 最 重要 的 设计 问题 。 

昌 针 不 像 数组 与 记录 ， 它 们 不 是 结构 化 的 类 型 ， 虽 然 在 指针 的 定义 中 使 用 了 一 个 类 型 操作 
符 〈 如 ， 在 C 和 C++ 中 的 *， 以 及 Ada 中 的 access)。 此 外 ， 卓 针 也 不 同 于 标量 变量 ， 因 为 指针 
全 前 被 用 来 引用 其 他 的 一 些 变量 ， 而 不 是 用 来 储存 某 类 数据 。 变 量 的 这 两 个 种 类 被 分 别称 为 引 
用 类 型 以 及 值 类 型 。 

指针 的 这 两 类 应 用 都 为 语言 增加 了 可 写 性 。 例 如 ， 假 设 我 们 必须 在 一 种 类 似 于 Fortran 77 的 
令 有 指针 的 语言 中 实现 一 种 二 又 树 之 类 的 动态 结构 ， 这 就 要 求 程序 人 员 提 供 并 且 维 护 一 组 树 节 
所 变量 ， 人 们 多 半 会 将 这 样 一 组 变量 实现 为 平行 数组 。 另 外 ， 因 为 在 Fortran 77 中 缺乏 动态 的 存 
储 空 间 ， 程 序 人 员 还 必须 猜测 所 需 节点 的 最 大 数目 。 显 然 ， 这 是 一 种 极为 别扭 与 麻烦 的 处 理 一 
又 树 的 方法 。 

将 要 在 第 6.9.7 节 讨论 的 引用 变量 与 指针 紧密 相关 ， 


6.9.1 设计 问题 


指针 所 特有 的 、 主 要 的 设计 问题 如 下 : 

“什么 是 指针 变量 的 作用 域 与 生存 期 ? 

“什么 是 堆 动 态 变量 的 生存 期 ? 

“二 将 指针 限制 在 它们 所 能 够 指向 的 值 的 类 型 之 上 吗 ? 

"年 将 指针 应 用 于 动态 存储 空间 的 管理 ， 还 是 应 用 于 间接 寻 址 ?或 者 用 于 这 两 者， 
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。 程 序 语言 是 应 该 支持 指针 类 型 ， 还 是 应 该 支持 引用 类 型 ? 或 者 应 该 支持 这 两 者 ? 
6.9.2 指针 操作 


提供 指针 类 型 的 语言 通常 包括 了 这 样 两 种 指针 的 基本 操作 : 即 赋值 与 间接 引用 。 第 一 种 操 
作 是 将 指针 变量 的 值 设置 于 某 个 有 用 的 地 址 。 如 果 只 是 使 用 指针 变量 来 管理 动态 存储 空间 ， 则 
无 论 通过 操作 符 还 是 通过 内 置 子 程序 所 构成 的 空间 分 配 机 制 都 能 够 设置 指针 变量 的 初始 值 。 如 
果 是 将 指针 用 于 非 堆 动态 变量 的 间接 寻 址 ， 那 么 就 必须 通过 一 个 显 式 操作 符 或 者 一 个 内 置 子 程 
序 来 获取 一 个 变量 地 址 ， 然 后 再 将 这 个 地 址 赋 给 指针 变量 。 

出 现在 表达 式 中 的 指针 变量 可 以 用 两 种 不 同 的 方式 来 解释 。 首 先 ， 可 以 将 它 解释 为 ， 它 是 
变量 所 绑 定 的 存储 单位 中 的 内 容 的 引用 ， 而 这 种 内 容 仅仅 是 一 个 地 址 。 这 恰恰 是 在 表达 式 中 的 
非 指针 变量 所 应 该 获得 的 解释 ， 只 是 在 那 种 情形 下 ， 存 储 单位 的 内 容 不 是 一 个 地 址 。 甚 次， 也 
可 以 将 一 个 指针 变量 解释 为 ， 它 是 一 个 存储 单位 中 的 值 的 引用 ， 而 这 个 存储 单位 的 地 址 储存 于 
变量 所 绑 定 的 单位 中 。 在 这 种 情形 下 ， 将 指针 解释 成 为 一 种 间接 引用 。 前 面 的 那 种 情形 是 通常 
的 指针 引用 ， 后 面 的 情形 则 是 指针 间接 引用 (dereferencing) 的 结果 。 间 接 引用 经 过 一 个 间接 的 
层次 来 进行 3| 用 ， 它 是 指针 的 第 二 种 基本 操作 。 

虽 针 的 间接 引用 可 以 是 显 式 的 或 者 隐 式 的 。 在 Fortran 95 中 它 是 隐 式 的 ， 但 是 在 一 些 当代 语 
言 中 ， 它 只 是 出 现在 显 式 说 明 时 。 在 C++ 中 ， 使 用 星 号 (*) 作为 前 级 一 元 操作 符 来 显 式 地 说 明 
间接 3 引用。 考虑 下 面 间 接 引用 的 例子 : 如 果 ptr 是 一 个 具有 值 为 7080 的 指针 变量 ， 其 地 址 为 
7080 的 存储 单位 ， 具 有 值 206， 那 么 赋值 语句 


3} = *ptr 
将 j 的 值 设 为 206。 这 个 过 程 被 显示 在 图 6-11 中 。 7080 有 
当 指针 指 加 记录 时 ， 用 于 引用 这 些 记 录 的 域 的 Ey a 


语法 根据 语言 的 不 同 而 不 同 。 在 C 和 C++ 中 ， 可 以 使 / 
用 两 种 指针 到 记录 的 方式 来 引用 这 个 记录 中 的 域 。 | 
如 果 一 个 指针 变量 p 指 癌 一 个 记录 ， 该 记录 具有 一 个 ptr| | 7080 | 
命名 为 age 的 域 ， 就 可 以 使 用 (*P) .age 来 引用 这 个 
域 。 当 操作 符 -> 被 用 于 所 指向 的 记录 的 指针 和 那 条 \ 
记录 的 域 之 间 时 ， 它 就 结合 了 间接 引用 以 及 域 的 引 Aig 
用 。 例 如 ， 表 达 式 p -> age 与 (*p) .age 是 等 价 
的 。 在 Ada 中 可 以 使 用 p.age， 因 为 指针 的 这 种 用 法 图 6-11 赋值 操作 j = *ptr 
是 隐 式 间接 引用 。 

为 扒 的 管理 而 提供 指针 的 语言 必须 包括 一 种 显 式 分 配 操作 。 有 时 是 通过 一 个 子 程序 来 进行 
分 配 的 说 明 ， 如 C 中 的 malloc。 在 支持 面向 对 象 程序 设计 的 语言 中 ， 常 常 是 使 用 new 操 作 符 来 
说 明 堆 对 象 的 分 配 。C++ 语 言 不 提供 隐 式 解除 分 配 ， 它 使 用 delete 作 为 解除 分 配 操 作 符 。 


6.9.3 指针 的 问题 
第 一 种 包括 了 指针 变量 的 高 级 程序 设计 语言 是 PL/UI。 在 PLVI 语 言 中 ， 指 针 可 以 被 用 来 引用 
堆 动态 变量 以 及 其 他 程序 变量 。PL/I 中 的 指针 具有 高 度 灵 活性 ， 但 是 这 些 指针 的 使 用 可 能 导致 


儿 种 程序 错误 。PL/I 中 指针 存在 的 问题 也 出 现在 一 些 后 继 语 言 的 指针 中 。 一 些 最 新 的 语言 ， 如 
Java， 已 经 使 用 引用 类 型 完全 取代 了 指针 ， 连 同 隐 式 解除 分 配 一 起 ， 从 而 消除 了 指针 所 带 来 的 


数据 类 型 197 





主要 问题 。 引 用 类 型 只 是 带 有 限制 操作 的 指针 。 第 6.9.7 节 将 讨论 引用 类 型 。 

6.9.3.1 悬挂 指针 

悬挂 指针 ， 或 悬挂 引用 ， 是 一 个 包含 了 已 解除 分 配 的 堆 动态 变量 地 址 的 指针 。 我 们 可 以 给 
出 几 个 理由 来 说 明 悬 挂 指针 是 危险 的 。 首 先 ， 悬 挂 指针 指向 的 位 置 可 能 已 经 被 重新 分 配给 一 个 
新 的 堆 动 态 变 量 。 如 果 这 个 新 变量 与 老 变量 不 是 同一 种 类 型 ， 对 悬挂 指针 使 用 的 类 型 检测 将 会 
和 无 效 的 。 即 使 这 个 新 动态 变量 与 老 动 态 变量 具有 相同 的 类 型 ， 它 的 新 值 将 与 老 指针 所 间接 引 
用 的 值 没 有 关系 。 此 外 ， 如 果 是 使 用 悬挂 指针 来 改变 堆 动态 变量 ， 新 堆 动态 变量 的 值 就 会 被 破 
坏 。 最后， 这 个 位 置 很 有 可 能 当前 暂时 被 存储 管理 系统 所 使 用 ， 可 能 是 作为 一 个 可 用 存储 块 链 
上 的 一 个 指针 ， 因 而 允许 这 个 位 置 的 值 的 改变 ， 这 将 导致 存储 管理 的 失败 。 

下 面 的 操作 序列 将 在 许多 语言 中 产生 一 个 悬挂 指针 ; 

1. 设 指针 p1 指 向 一 个 新 的 堆 动态 变量 。 

2. 给 指针 p2 赋 以 p1 的 值 。 

3. 将 p1 所 指向 的 堆 动 态 变量 显 式 地 回收 ( 设 p1 指 向 空 ni1)， 但 是 这 种 操作 并 不 改变 指针 
P2。P2 现 在 成 为 了 一 个 悬挂 指针 。 如 果 回 收 操作 不 改变 p1，p1 和 p2 都 将 是 悬挂 的 。 

例如 在 C++ 中 ， 我 们 可 能 有 

int * arrayPtrl; 

int * arrayPtr2 = new int[100]; 

arrayPtrl = arrayPtr2; 


delete [] arrayPtr2; 
// 现在 arrayPtr1 是 悬挂 的 ， 因 为 arzayPtzr1 所 指向 的 堆 存 储 空间 已 经 被 回收 了 。 


6.9.3.2 丢失 的 堆 动 态 变 量 

丢失 的 堆 动 态 变量 是 一 个 已 经 分 配 的 堆 动 态 变量 ， 用 户 程 序 不 可 以 再 对 它 进行 访问 。 常 常 
称 这 种 变量 为 垃圾 ， 因 为 对 于 它们 的 原始 目的 ， 它 们 不 再 有 用 ， 并 且 它 们 也 不 可 以 为 了 某 种 新 
的 用 途 通过 程序 给 以 重新 分 配 。 最 前 见 的 丢失 的 堆 动态 变量 是 由 下 面 的 操作 序列 所 产生 的 ; 

1. 设置 指针 pl 指向 一 个 新 创建 的 堆 动 态 变 量 。 

2. 在 后 来 ， 又 设置 pl 指向 另 一 个 新 创建 的 堆 动 态 变量 。 

现在 ， 第 一 个 堆 动 态 变量 就 是 不 可 以 访问 的 ， 或 者 称 它 为 丢失 的 。 有 时候 ， 将 它 称 为 存储 
尼 泄 漏 。 存 储 器 泄漏 是 一 个 问题 ， 无 论语 言 使 用 的 是 隐 式 还 是 显 式 的 解除 分 配方 法 。 

在 下 面 的 几 个 小 节 中 ， 我 们 将 研究 语言 的 设计 人 员 是 怎样 处 理 悬 挂 指针 以 及 技 失 的 堆 动态 
变量 的 问题 。 


6.9.4 _ Ada 语言 中 的 指针 


问题 ， 因 为 不 恰当 地 实现 显 式 解除 分 配 ， 是 产生 悬挂 指针 的 主要 原因 然而 不 幸 的 是 ，Ada 语 
言 还 是 包括 了 一 个 显 式 解 除 分 配 符号 ， Uncheckeqd_ Deallocation， 这 个 名 字 的 本 身 就 意味 
着 并 不 鼓励 它 的 使 用 ， 或者， 至 少 是 警告 用 户 它 可 能 具有 的 潜在 问题 ， 

于 失 的 堆 动 态 变量 的 问题 并 没有 通过 Ada 的 指针 设计 而 得 以 消除 。 
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6.9.5 C 和 C++ 中 的 指针 


C 和 C++ 中 指针 的 用 法 很 像 汇编 语言 中 地 址 的 使 用 。 这 意味 着 它们 具有 极 大 的 灵活 性 ， 因 和 而 
在 使 用 时 必须 极其 小 心 。 这 些 语言 的 设计 没有 针对 悬挂 指针 或 丢失 的 堆 动态 变量 问题 提供 解决 
办 法 。 然 而 在 C 和 C++ 中 可 以 进行 指针 算术 ， 这 使 得 它们 的 指针 比 其 他 程序 设计 语言 中 的 指针 更 
为 有 趣 。 

不 像 Ada 中 的 指针 只 能 指向 堆 ， 在 C 和 C++ 中 的 指针 几 
nader psige TUM, Reem T Ae. $ 

pew Aaispose, 由 于 实 上 ， 它 们 可 以 指向 存储 空间 的 任何 位 置 ， 而 不 论 在 这 个 位 

dispose 会 引起 是 挂 指针 问题 ， 当 置 上 有 没有 变量 的 存在 ， 这 也 是 这 些 指针 的 危险 性 所 在 。 


程序 中 出 现 了 dispose 时 ， 一 些 在 C 和 C++ 中 , * 表 示 间 接 引 用 操作 ， MERR ERE 
Pascal 的 实现 就 干脆 将 它 忽略 掉 。 地 址 的 操作 符 。 例 如 ， 在 下 面 的 代码 中 

虽然 这 种 方式 有 效 地 防止 了 是 挂 int *ptr; 

指针 的 问题 ， 但 在 同时 ， 它 却 不 int count, init; 

允许 重复 使 用 那些 程序 已 经 不 再 


ptr = &init; 
count = *ptr; 


需要 的 堆 存 储 空间 。 前 面 讲 过 ， 
Pascal 语 言 是 作为 一 种 教学 语言 
设计 的 ， 而 不 是 作为 一 种 工业 化 对 变量 Ptz 的 赋值 ， 将 Ptz 设 为 init 的 地 址 。 第 一 条 
的 工具 。 对 count 的 赋值 语句 间接 引用 ptr 以 产生 init 处 的 值 ， 然 
后 又 将 这 个 值 赋 给 count 。 因 而 前 面 两 条 赋值 语句 的 效应 

是 将 init 的 值 赋 给 count。 请 注意 ， 一 个 指针 的 声明 定义 了 它 的 域 类 型 。 

注意 ， 这 里 的 两 条 赋值 语句 等 价 于 下 面 的 这 一 条 作用 在 count 上 的 赋值 语句 : 

count = init; 

可 以 给 指针 赋 以 任何 正确 的 域 类 型 变量 的 地 址 值 ， 或 者 ， 可 以 给 它们 赋 以 用 来 表示 空 值 
nila. 

也 可 以 在 一 些 受 限 形式 中 进行 指针 算术 。 例 如 ， 如 果 ptr 是 一 个 指针 变量 ， 它 被 声明 为 指 
癌 某 个 数据 类 型 的 某 个 对 象 ， 那 么 


ptr + index 


是 一 个 合法 的 表达 式 。 这 种 表达 式 的 语义 如 下 面 所 描述 。 这 里 ， 并 不 是 简单 地 将 index 的 
值 加 到 ptr 之 上 ， 相 反 ， 它 首先 将 ijndex 的 值 根据 ptr 所 指向 的 存储 单位 的 大 小 (以 存储 单位 
th) 按 比 例 放大 。 例 如 ， 如 果 ptr 指 向 的 是 放置 一 个 具有 四 个 存储 单位 大 小 的 类 型 的 存储 单位 ， 
那么 就 将 index 乘 以 4， 并 且 将 这 个 乘法 的 结果 加 到 ptr 上 。 这 种 地 址 算术 的 主要 目的 是 数组 的 
管理 。 下 面 ， 我 们 仅仅 讨论 一 维 数组 的 情形 。 : 

在 C 和 C++ 中 ， 所 有 数组 都 使 用 零 作 为 下 标 范围 的 下 限 ， 而 且 没 有 下 标的 数组 名 表示 的 总 是 
这 个 数组 中 第 一 个 元 素 的 地 址 。 事 实 上 ， 可 以 完全 像 处 理 指针 那样 来 处 理 没 有 下 标的 数组 名 ， 
除了 它 本 身 是 一 个 常量 ， 并 因此 不 能 够 对 它 赋值 以 外 。 考 虑 下 面 的 声明 : 

int list [10]; 


int *ptr: 
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ptr = list; 
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这 条 语句 可 以 理解 为 将 list [0] 的 地 址 赋 给 ptz， 因 为 没有 下 标的 数组 名 解释 为 这 个 数 
组 的 基 址 。 对 于 这 一 条 赋值 语句 ， 我 们 能 得 出 下 面 的 结论 : 

**(ptr + 1) 5 list [1] Sor. 

e*(ptr + index) 4 list [index] 等 价 。 

*ptr [index] 与 list [index] 等 价 。 

这 些 语 句 清 楚 地 表明 ， 指 针 操 作 包 括 了 与 下 标 操 作 相同 的 按 比 例 缩放 。 此 外 ， 可 以 将 指向 
数组 的 指针 像 数 组 名 一 样 进 行 索 引 。 

在 C 和 C++ 中 的 指针 可 以 指向 函数 。 这 种 特征 被 用 来 将 函数 作为 参数 传递 给 其 他 的 函数 。 第 
9 章 中 将 要 讨论 到 ， 指 针 也 被 用 于 参数 传递 。 

C 和 C++ 包括 了 void * 类 型 的 指针 ， 这 意味 着 它们 可 以 指向 任何 类 型 的 值 。 它 们 实际 上 是 
一 些 通用 指针 。 然 而 ， 因 为 不 可 以 间接 引用 void * 指 针 ， 所 以 它们 不 存在 类 型 检测 的 问题 。 
void * 指 针 的 一 种 常见 应 用 是 作为 运用 于 存储 空间 的 函数 的 参数 。 例 如 ， 假 设 我 们 想 要 用 一 
个 函数 将 一 个 数据 字 市 的 序列 从 存储 空间 里 的 一 处 移 到 另 一 处 。 如 果 这 个 函数 可 以 传递 两 个 任 
意 类 型 的 指针 ， 则 将 是 最 一 般 的 。 如 果 这 个 函数 中 相应 的 形 参 为 void * 类 型 ， 就 会 是 合法 的 。 
然后 这 个 函数 可 以 将 形 参 转换 为 char * 类 型 并 完成 操作 ， 而 不 论 传递 的 是 什么 类 型 的 指针 作 
为 实 参 。 


6.9.6 引用 类 型 


引用 类 型 变量 类 似 于 指针 ， 除 了 一 个 重要 而 且 基 本 的 不 同 之 处 :指针 指示 内 存 中 的 地 址 ， 
而 引用 指示 内 存 中 的 对 象 或 值 。 因 此 ， 尽 管 在 地 址 上 做 算术 运算 是 很 自然 而 然 的 ， 但 对 引用 做 
算术 运算 则 是 不 合适 的 。 

C++ 语 言 包 括 了 一 种 特殊 的 指针 类 型 。 这 种 类 型 主要 用 于 函数 定义 中 的 形 参 。C++ 的 引用 
类 型 变量 是 一 个 总 是 被 隐 式 间接 引用 的 、 具 有 固定 值 的 指针 。 因 为 C++ 引用 类 型 变量 是 一 个 党 
量 ， 所 以 在 它 的 定义 中 它 必须 以 某 个 变量 的 地 址 来 做 初始 化 ， 并 且 在 初始 化 后 ， 引 用 类 型 变量 
不 能 再 被 设置 来 引用 任何 其 他 变量 。 隐 式 间 接 引用 阻止 了 对 引用 变量 的 地 址 值 的 赋值。 

5| 用 类 型 变量 通过 在 定义 中 将 & 符 号 放置 于 它们 的 名 字 之 前 来 说 明 。 例 如 ， 

int result = 0; 

int &ref result = result; 


ref result = 100; 


在 这 一 段 代 码 中 ，result 和 ref result 互 为 别名 。 

当 引 用 类 型 在 函数 定义 中 被 用 作 形 参 时 ， 它 在 调用 函数 与 被 调用 函数 之 间 提 供 了 双向 交流 。 
因为 C++ 的 参数 是 按 值 传递 的 ， 所 以 对 非 指 针 的 参数 类 型 这 是 不 可 能 的 。 将 指针 作为 参数 传递 
也 实现 了 双向 交流 ， 但 由 于 指针 的 形 参 要 求 显 式 间接 引用 ， 这 就 导致 了 较 差 的 代码 可 读 性 和 安 
全 性 。 在 被 调用 函数 中 施行 引用 参数 的 引用 ， 完 全 与 引用 其 他 的 参数 相同 。 当 一 个 实 参 所 对 应 
的 形 参 是 引用 类 型 时 ， 调 用 函数 不 需要 说 明 这 个 实 参与 众 有 什么 不 同 。 编 译 器 会 传递 地 址 而 非 
值 给 引用 参数 。 

Java 中 的 引用 变量 是 C++ 中 引用 变量 形式 的 扩展 ， 它 使 用 引用 变量 完全 地 替代 了 指针 。 为 
了 所 求 比 C++ 更 好 的 安全 性 ，Java 的 设计 人 员 完 全 去 掉 了 C 和 C++ 式 的 指针 。 不 像 CH+ 引 用 变量 ， 
为 了 能 引用 不 同 的 类 实例 ， 可 以 给 Java 中 的 引用 变量 赋值 ， 也 就 是 说 ， 它 们 不 是 常数 。 所 有 
Java 中 的 类 实例 都 通过 引用 变量 来 引用 。 这 事实 上 也 是 Java 中 引用 变量 的 唯一 用 途 。 关 于 这 些 
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问题 还 将 在 第 12 章 中 进一步 讨论 。 
在 下 面 的 代码 中 ，String 是 一 个 标准 的 Java 类 : 


String strl; 
strl = "This is a Java literal string"; 


这 段 代码 将 str1 定 义 为 对 String 类 的 实例 或 对 象 的 一 个 引用 ,但 将 其 初始 设 为 空 。 后 面 
的 赋值 语句 设 str1 引 用 String 类 中 的 对 象 ; “This is a Java literal string”, 

Java 的 类 实例 是 隐 式 地 被 解除 分 配 的 (没有 显 式 解 除 分 配 的 操作 符 ) ， 因 而 不 会 有 悬挂 
引用 。 

C# 既 包括 了 Java 中 的 引用 ， 又 具有 C++ 中 的 指针 。 但 是 C# 却 极 不 鼓励 使 用 指针 。 事 实 上 ， 
任何 使 用 指针 的 方法 都 必须 包括 unsafe 修 饰 符 。 请 注意 ， 尽 管 被 引用 指向 的 对 象 是 被 隐 式 解 
除 分 配 的 ， 但 被 指针 指向 的 对 象 却 不 是 这 样 。 之 所 以 在 C# 中 包括 进 指针 ， 主 要 是 为 了 能 够 介 许 
C# 程 序 与 C 以 及 C++ 的 程序 相 兼 容 。 

在 纯 面 向 对 象 语言 Smalltalk、Python 和 Ruby 中 的 所 有 变量 都 是 引用 。 它们 总 是 隐 式 地 间接 
引用 ， 而 且 ， 这 些 变量 的 直接 值 不 能 够 访问 到 。 


6.9.7 评估 
关于 巷 挂 指针 以 及 垃圾 的 问题 ， 已 经 进行 了 较 多 的 讨论 。 堆 管理 的 问题 将 在 第 6.9.9.3 节 进 
行 讨论 。 


入 们 曾经 将 指针 与 goto 语 名 进行 比较 。goto 语 句 扩 宽 了 下 一 条 可 以 执行 的 语句 的 范围 。 
而 指针 变量 则 拓 广 了 一 个 变量 所 能 够 引用 的 存储 单位 的 范围 。 大 概 对 于 指针 最 强烈 的 谴责 莫 过 
于 Hoare (1973) 所 声称 的 :“ 将 指针 引入 高 级 语言 中 ， 是 我 们 已 经 无 法 复原 的 一 大 退步 .， 

力 一 方面 ， 在 一 些 程序 设计 应 用 程序 中 ， 指 针 是 很 基本 的 。 例 如 ， 在 编写 设备 驱动 时 ， 指 
针 是 必需 的 ， 因 为 在 那里 会 访问 到 具体 的 、 绝 对 的 地 址 。 

Java 以 及 C# 中 的 引用 提供 了 指针 的 某 种 程度 的 灵活 性 及 能 力 ， 但 不 具有 指针 的 危险 性 ， 程 
序 人 员 是 否 愿 意 牺 和 性 C 和 C++ 中 指针 的 完全 功能 来 换取 引用 的 较 强 安全 性 能 ， 还 有 待 观察 ，C# 
程序 在 指针 方面 的 扩展 就 是 对 这 个 问题 的 一 个 衡量 。 


6.9.8 指针 类 型 和 引用 类 型 的 实现 


在 大 多 数 语 言 中 ， 指 针 被 用 于 堆 管 理 。Java 和 C# 中 的 引用 以 及 Smalltalk、 Python 和 Ruby 中 
的 变量 也 同样 应 用 于 堆 管 理 ， 因 而 我 们 应 该 等 同 地 对 待 指针 与 引用 。 下 面 ， 我 们 首先 简略 地 描 
述 指针 和 引用 是 怎样 表示 的 ， 然 后 ， 再 讨论 两 种 可 能 的 解决 悬挂 指针 问题 的 办 法 ， 最 后 ， 我 们 
将 描述 堆 管 理 技术 中 的 一 些 主要 问题 。 

6.9.8.1 指针 与 引用 的 表示 

在 大 多 数 较 大 型 计算 机 中 ， 指 针 和 引用 是 储存 于 存储 单位 中 的 单个 值 。 然 而 ， 大 多 数 的 微型 
计算 机 是 基于 英特尔 微 处 理 器 的 ， 它 们 中 的 地 址 分 为 两 个 部 分 ， 即 段 和 偏 移 量 。 因此 在 这 些 系统 
中 将 指针 和 引用 实现 为 一 对 16 个 字 位 的 单位 ， 一 个 单位 对 应 于 段 ， Fi BADER OF St 

6.9.8.2 解决 悬挂 指针 问题 的 办 法 

针对 悬挂 指针 的 问题 已 经 有 了 几 种 提议 的 解决 方法 。 其 中 有 墓碑 (tombstone) (Lomet, 
1975) 方法 ， 在 幕 碑 方法 中 ， 每 一 个 堆 动 态 变量 都 包括 了 一 个 被 称 为 墓碑 的 特殊 单位 ， 墓 碑 自 
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身 就 是 指向 堆 动 态 变量 的 一 个 指针 。 实 际 的 指针 变量 只 是 指向 墓碑 ， 而 不 是 指向 堆 动态 变量 。 
当 将 一 个 堆 动态 变量 解除 分 配 时 ， 墓 碑 则 还 被 保持 着 ， 只 是 被 设 为 空 (null)， 这 就 指示 堆 动 
态 变 量 已 经 不 存在 。 这 种 方式 防止 了 指针 再 指向 一 个 被 解除 分 配 了 的 变量 。 对 于 指向 空 值 的 墓 
碑 指针 的 任何 引用 都 被 检测 为 错误 。 

无 论 就 时 间 方面 还 是 空间 方面 而 言 ， 墓 碑 方 法 的 代价 都 是 十 分 高 的 。 因 为 从 来 不 会 将 墓碑 
解除 分 配 ， 因 而 它们 所 占据 的 存储 空间 就 不 会 被 重新 使 用 。 每 一 次 经 过 墓碑 来 对 堆 动态 变 量 进 
行 存 取 ， 都 要 求 有 更 多 的 间接 层次 ， 而 这 在 大 多 数 的 计算 机 上 就 需要 额外 的 机 如 周 期 。 显 然 ， 
流行 语言 的 设计 人 员 并 不 认为 所 增加 的 安全 性 能 够 值得 付出 这 些 额 外 的 代价 ， 因 为 没有 一 种 三 
泛 应 用 的 语言 使 用 了 墓碑 。 

募 碑 的 一 种 替代 方法 是 用 于 UW-Pascal (Fischer and LeBlanc, 1977, 1980) 实现 中 的 锁 一 
钥匙 方法 (locks-and-keys approach) 。 在 这 种 编译 器 中 ， 指 针 值 被 表示 为 一 些 顺 序 的 对 (钥匙 ， 
地 址 )， 在 这 里 钥匙 是 一 个 整数 值 。 堆 动态 变量 被 表示 为 变量 的 存储 空间 再 加 上 一 个 存储 整数 锁 
值 的 头 单位 。 当 堆 动 态 变 量 被 分 配 存储 空间 时 ， 锁 值 被 创建 并 被 放置 在 堆 动 态 变量 的 锁 单 位 中 ， 
同时 也 被 放置 在 对 new 的 调用 中 所 指明 的 指针 的 钥匙 单位 中 。 对 于 间接 引用 指针 的 每 一 次 存 取 ， 
都 将 进行 指针 的 钥匙 值 与 堆 动态 变量 中 的 锁 值 乙 间 的 比较 。 如 果 它 们 相 匹 配 ， 这 种 存 取 就 是 合 
法 的 ; 不然， 就 会 将 这 种 存 取 处 理 为 运行 时 错误 。 任 何 指针 值 对 其 他 指针 的 拷贝 都 必须 复制 这 
种 钥匙 值 。 因 此 ， 任 意 数目 的 指针 都 可 以 引用 同一 个 堆 动 态 变 量 。 当 使 用 aispose 将 一 个 堆 动 
态 变 量 解除 分 配 时 ， 就 将 这 个 变量 的 锁 值 清理 成 为 一 个 不 合法 的 锁 值 。 此 时 ， 如 果 间 接 引 用 一 
个 在 Qispose 说 明 以 外 的 指针 时 ， 虽 然 指针 的 地 址 值 并 疫 有 被 改变 ， 但 是 它 的 钥匙 值 将 不 再 与 
这 个 锁 值 相 匹配 ， 因 此 对 于 它 的 存 取 将 不 被 允许 。 

当然 ， 解 决 悬 挂 指针 问题 的 最 好 办 法 是 取 销 程序 人 员 将 堆 动 态 变 量 解 除 分 配 的 权力 。 如 果 
程序 不 能 够 显 式 地 将 推动 态 变 量 解除 分 配 ， 就 不 会 有 悬挂 指针 。 要 达到 这 一 目的 ， 运 行 时 系统 
就 必须 将 它们 不 再 需要 的 堆 动 态 变 量 隐 式 地 解除 分 配 。LISP 的 系统 就 是 这 样 实施 的 。Java 以 及 
C# 也 对 它们 的 引用 变量 施行 这 样 的 方式 。 前 面 讲 过 ，C# 中 的 指针 是 不 具有 隐 式 解除 分 配 的 。 

6.9.8.3 HSF 

堆 管 理 可 以 是 一 种 非常 复杂 的 运行 时 过 程 。 我 们 分 别 从 两 种 情形 来 研究 这 个 过 程 : 其 一 ， 
所 有 的 堆 存 储 空 间 都 以 同样 大 小 的 单位 进行 分 配 与 解除 分 配 ， 其 二 ， 以 大 小 可 变 的 段 进行 分 配 
与 解除 分 配 。 请 注意 ， 我 们 仅仅 讨论 隐 式 的 解除 分 配方 式 。 我 们 的 讨论 将 会 比较 简略 ， 不 可 能 
包罗 万 象 ， 因 为 透彻 地 分 析 这 些 过 程 以 及 与 这 些 过 程 相 关 的 问题 ， 更 像 是 一 个 实现 问题 ， 而 不 
是 语言 设计 问题 。 

单一 大 小 的 单位 ”最 简单 的 情形 是 所 有 被 分 配 以 及 解除 分 配 的 单位 都 是 同样 大 小 的 。 如 果 
每 个 单位 都 已 经 包含 了 一 个 指针 ， 这 时 的 情形 就 被 进一步 地 简化 了 。 这 正 是 许多 LISP 实 现 中 的 
情形 ， 在 那里 ， 动 态 存储 空间 分 配 的 问题 第 一 次 以 大 规模 出 现 。 所 有 LISP 的 程序 以 及 大 部 分 
LISP 中 的 数据 ， 都 由 连接 为 链表 的 单位 构成 。 

在 按 同一 大 小 的 单位 进行 分 配 的 堆 中 ， 通 过 单位 中 的 指针 将 所 有 可 以 使 用 的 单位 连接 起 来 ， 
从 而 形成 一 个 可 用 空间 的 链表 。 当 需要 时 ， 存 储 空间 的 分 配 就 仅 从 链表 上 取得 所 需 数 目的 单位 。 
但 解除 分 配 是 一 个 远 为 复杂 的 过 程 。 因 为 多 个 指针 可 以 同时 指向 一 个 堆 动态 变量 ， 这 使 得 难以 
确定 程序 是 否 已 经 不 再 需要 这 个 变量 。 仅 仅 因 为 有 一 个 指针 已 经 不 再 指向 这 个 单位 ， 显 然 不 足 
以 使 这 个 单位 成 为 垃圾 ;其 他 的 几 个 指针 可 能 仍旧 指向 这 个 单位 。 

在 LISP 中 ， 程 序 中 的 几 种 最 常见 操作 会 产生 一 些 程序 不 再 能 够 存 取 因而 应 该 被 解除 分 配 
( 放 回 可 用 空间 链表 的 后 部 ) 的 存储 单位 。LISP 的 基本 设计 目标 之 一 就 是 要 确保 不 由 程序 人 员 
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回收 那些 不 再 使 用 的 单位 ， 这 个 任务 要 由 运行 时 系统 来 施行 。 这 就 给 LISP 的 实现 人 员 留 下 了 
一 个 基本 设计 问题 : 应 该 在 什么 时 候 进 行 解除 分 配 的 工作 ? 

有 一 些 不 同 的 方法 用 于 垃圾 收集 。 两 种 最 常用 的 传统 技术 在 某 种 意义 上 是 反 向 的 过 程 。 它 
们 是 引用 计数 器 法 和 标记 清除 法 。 在 引用 计数 器 方法 中 ， 回 收 是 递增 的 ， 只 要 出 现 了 不 能 被 访 
问 的 单位 就 回收 ， 而 在 标记 清除 方法 中 ， 回 收 仅仅 发 生 于 可 用 空间 的 链表 为 空 时 。 有 了 时， 我 们 
将 这 两 种 方法 分 别称 为 积极 方法 (eager approach) 和 懒惰 方法 (lazy approach) 。 这 两 种 方法 衍 
生出 了 许多 变化 。 然 而 ， 在 本 书 中 ， 我 们 只 讨论 基本 过 程 。 

存储 空间 回收 的 引用 计数 器 方法 是 通过 在 每 一 个 单位 中 保持 一 个 计数 器 来 达到 它 的 目标 ， 
在 这 个 计数 器 中 储存 了 当前 指向 这 个 单位 的 指针 数目 。 幅 入 式 的 引用 计数 器 的 减 值 操作 包括 了 
零 值 的 检测 ， 当 每 次 有 一 个 指针 与 这 个 单位 分 离 时 ， 计 数 器 的 值 就 减 1。 如 采 引 用 计数 器 达到 了 
零 值 ， 这 意味 着 已 经 没有 一 个 程序 指针 还 在 指向 这 个 单位 ， 这 个 单位 因此 成 为 了 垃圾 ， 可 以 被 
回收 到 可 用 空间 的 链表 之 上 。 

?用 计数 器 的 方法 存在 三 个 问题 。 第 一 ， 如 果 存 储 单位 相对 较 小 ， 计 数 器 所 需要 的 空间 就 
会 三 据 很 大 比例 。 第 二 ， 为 了 维持 计数 器 的 值 ， 显 然 需要 一 些 执行 时 间 。 每 一 次 改变 指针 的 值 ， 
这 个 指针 曾经 指向 的 单位 就 必须 将 它 的 计数 器 递减 ， 而 指针 当前 指向 的 单位 就 必须 将 它 的 计数 
are 痢 。 在 一 种 类 似 LISP 的 语言 中 ， 其 中 的 每 一 个 动作 几乎 都 包括 了 指针 的 变更 ， 这 可 以 耗费 
垣 总 执行 时 间 的 很 大 部 分 。 当 然 ， 如 果 指 针 的 改变 不 是 太 频 繁 ， 这 显然 不 成 为 一 个 问题 ， 通 过 
一 种 称 为 延迟 引用 计数 的 方法 可 以 清除 一 些 引 用 计数 器 的 无 效率 ， 延 迟 引用 计数 能 为 一 些 指针 
避免 引用 计数 器 。 第 三 ， 当 一 组 单位 被 连接 成 环 状 时 ， 情 况 就 趋 于 复杂 化 。 这 里 的 问题 是 ， 在 
环 状 链表 中 每 一 个 单位 的 引用 计数 器 值 至 少 为 !1， 从 而 阻止 了 这 个 单位 的 收集 ， 不 能 将 它 放 回 
可 用 空间 的 链表 之 上 。 关 于 这 个 问题 的 一 种 解决 办 法 ， 在 Friedman 和 Wise (1979) 的 文章 中 可 
读 到 。 

? 用 计数 器 方 法 的 优点 是 它 在 本 质 上 是 递增 的 。 它 的 动作 随 着 应 用 程序 插入 ， 因 此 ， 在 应 
用 程序 执行 中 ， 它 不 会 引 走 较 大 的 延 时 。 

最 忽 的 垃圾 收集 的 标记 清除 过 程 执行 如 下 : 运行 时 系统 按照 要 求 分 配 存储 单位 ， 并 且 在 需 
要 时 将 指针 从 这 些 单位 上 脱离 下 来 ， 且 并 不 牵涉 到 存储 空间 的 回收 (EER ZR), HAZ 
先 已 经 将 所 有 可 用 单位 分 配 完毕 。 此 时 ， 标 记 清除 过 程 开 始 收集 堆 中 的 所 有 垃圾 。 为 了 帮助 这 
种 标记 清除 过 程 ， 每 一 个 堆 单 位 都 具有 一 个 额外 的 指示 器 字 位 或 域 ， 以 供 收集 算法 使 用 ， 

这 种 标记 清除 过 程 包括 了 三 个 不 同 的 阶段 。 首 先 ， 将 堆 中 所 有 单位 的 指示 器 都 设置 成 表示 
这 宇 单 位 为 垃圾 。 当 然 ， 这 种 假设 只 对 一 部 分 单位 是 正确 的 。 收 集 过 程 的 第 二 个 阶段 (标记 阶 
Be) 是 最 困难 的 。 这 时 程序 中 的 每 一 个 指针 将 追踪 到 堆 中 ， 并 且 将 所 有 可 以 达到 的 单位 都 标记 
成 非 垃 圾 。 之 后 执行 第 三 个 阶段 (清除 阶段 ) 将 堆 中 所 有 没有 特别 标记 为 正在 使 用 的 单位 返回 
给 可 用 空间 的 链表 。 

为 了 说 明 用 于 标记 正 使 用 单位 的 算法 风格 ， 我 们 提供 下 面 这 种 标记 算法 的 简单 版 本 ， 假 设 
所 有 的 堆 动态 变量 或 者 堆 单位 都 包括 了 一 个 信息 部 分 、 一 个 被 命名 为 tag 的 标记 部 分 ， 以 及 两 
个 锌 分 别 命名 为 11ink 和 +1ink 的 指针 。 这 些 单位 被 用 来 建立 一 种 有 向 图 ， 图 中 最 多 只 具有 来 
日 任 一 市 点 的 两 条 边 。 这 种 标记 算法 遍历 图 中 所 有 的 生成 树 ， 标 记 出 所 有 被 找到 的 单位 。 像 其 
他 图 过 历 一 样 ， 标 记 算法 使 用 递归 。 

for every pointer r do 


mark(r) 


void mark(void * ptr) { 
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if (ptr != 0) 
if (*ptr.marker is not marked) { 
set *ptr.marker 
mark(*ptr.llink) 
mark(*ptr.rlink) 
} 
} 


图 6-12 显 示 了 将 这 个 过 程 作用 于 一 个 给 定 图 的 例子 。 这 种 简单 标记 算法 要 求 大 量 的 存储 空 
B (用 栈 空间 来 支持 递归 )。Schorr 和 Waite 开 发 了 一 种 不 需要 额外 栈 空间 的 标记 程序 (Schorr 
and Waite，1967)。 他 们 的 方法 是 在 追踪 出 链接 结构 的 时 候 ， 将 指针 反 转 。 然 后 在 到 达 链 表 的 
尾 师 时 ， 处 理 过 程 可 以 跟随 指针 在 结构 中 反 向 进行 。 
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虚线 显示 了 node_making 的 顺序 
图 6-12 标记 算法 行为 的 一 个 例子 

使 用 标记 清除 的 最 初版 的 最 大 问题 是 ， 它 工作 得 太 不 频繁 了 一 一 只 有 在 程序 用 完 或 即将 用 
元 所 有 的 堆 存 储 空间 时 工作 。 在 这 种 情形 下 ， 标 记 清除 会 花费 大 量 的 时 间 ， 因 为 大 部 分 单元 必 
领 在 使 用 时 跟踪 和 标记 。 这 会 在 应 用 程序 运行 时 产生 一 个 显著 的 延 时 。 而 且 ， 这 个 过 程 可 能 只 
会 生成 很 少 的 放置 在 可 用 空间 列表 的 单元 。 这 个 问题 慢 慢 得 到 了 改善 。 例 如 ， 在 回收 存储 器 的 
数量 上 ， 在 内 存 耗 尽 之 前 ， 增 量 标记 清除 垃圾 收集 能 更 频繁 、 更 有 效 地 工作 . 

这 个 过 程 每 一 轮 的 时 间 明 显 减 少 了 ， 因 此 减少 了 应 用 程序 执行 时 的 延 时 。 另 一 种 可 供 替代 
的 方法 是 在 不 同时 间 部 分 执行 标记 清除 过 程 ， 而 不 是 全 部 内 存 。 这 样 ， 它 能 取得 和 增 量 标记 清 
除法 同样 的 效果 。 

标记 清除 方法 的 标记 算法 以 及 引用 计数 器 方法 所 需要 的 过 程 ， 都 可 以 通过 使 用 Suzuki 描 本 
的 指针 旋转 和 滑行 操作 而 更 具有 效率 (Suzuki, 1982), 

A] EK) ADA 管理 一 个 可 以 分 配 可 变 大 小 单位 的 堆 时 ， 不 但 具有 单一 大 小 单位 分 配 的 一 
切 困 难 ， 还 具有 一 些 额外 的 问题 。 但 大 多 数 程序 设计 语言 会 需要 可 变 大 小 的 单位 。 取 决 于 所 
用 方法 的 不 同 ， 管 理 可 变 大 小 单位 中 的 额外 问题 也 就 不 一 样 。 如 果 使 用 的 是 垃圾 收集 方法 ， 就 
会 出 现下 述 的 额外 问题 . 

“将 堆 中 所 有 单位 的 指示 器 设 定 初 值 以 指示 这 些 单位 为 垃圾 ， 这 是 很 困难 的 过 程 。 因 为 这 

宇 盾 位 都 具有 不 同 的 大 小 ， 对 它们 进行 扫描 就 是 一 个 问题 。 对 于 这 个 问题 的 一 种 解决 办 

法 在 要 求 将 每 一 个 单位 中 的 第 一 个 域 用 来 表示 单位 大 小 。 接 下 来 就 能 够 完成 扫描 ， 尽 管 

这 种 做 法 与 单一 大 小 单位 的 同类 型 操作 相 比 会 需要 稍 大 的 空间 和 稍 长 的 时 间 
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。 这 种 标记 过 程 不 是 简单 的 。 如 果 没 有 预先 定义 的 位 置 来 存放 指向 单位 的 指针 ， 怎 么 能 够 
从 指针 进行 链 的 跟踪 ? 完全 不 包含 指针 的 单位 也 是 一 个 问题 。 将 系统 指针 附 于 每 一 个 单 
位 是 一 种 解决 办 法 ， 但 是 必须 将 这 些 指针 与 用 户 定义 的 指针 保持 平行 。 这 会 在 程序 运行 
的 代价 上 再 加 上 空间 和 执行 时 间 的 额外 开销 。 
。 维 护 可 用 空间 的 链表 是 另 一 种 额外 开销 。 在 开始 时 ， 这 种 链表 只 有 一 个 单位 ， 它 包括 了 
所 有 可 用 的 空间 。 对 空间 的 不 断 需求 减少 了 这 种 块 的 大 小 。 回 收 的 单位 被 增加 到 链表 上 。 
不 久之 后 ， 这 种 链表 变 成 了 一 长 列 各 种 不 同 大 小 的 段 (或 块 )。 这 就 减 慢 了 分 配 的 速度 ， 
因为 分 配 需 要 搜索 这 个 链表 ， 以 找到 足够 大 的 段 。 最 终 ， 这 个 链表 可 能 包括 了 大 量 非 常 
小 的 块 ， 而 对 于 大 部 分 的 需求 它们 都 不 足够 大 。 此 时 ， 可 能 需要 将 相 邻 的 块 合 并 成 为 较 
大 的 块 。 另 一 种 方法 是 将 链表 按 块 的 大 小 排序 ， 这 样 可 以 缩短 找到 足够 大 的 块 的 时 间 。 
但 无 论 上 述 两 种 方法 中 的 哪 一 种 ， 链 表 的 维护 都 成 为 额外 的 开销 。 

如 人 朱 使 用 引用 计数 右 ， 前 两 个 问题 就 能 够 避免 ， 但 可 用 空间 链表 的 维护 问题 仍然 会 存在 。 


小 结 


一 种 语言 的 数据 类 型 很 大 程度 上 决定 了 这 种 语言 的 风格 ， 以 及 这 种 语言 的 应 用 。 语 言 的 数据 类 型 与 
语言 的 控制 结构 一 起 ， 形 成 了 一 种 语言 的 核心 部 分 。 

大 多 数 命 令 式 语言 的 基本 数据 类 型 包括 数值 类 型 、 字 符 类 型 和 布尔 类 型 。 数 值 类 型 常常 由 硬件 直接 
支持 。 

用 户 定义 的 枚 举 类 型 和 子 范围 类 型 既 方 便 应 用 ， 又 增加 了 程序 的 可 读 性 与 可 靠 性 。 

数组 是 大 多 数 程 序 设 计 语 言 的 部 分 。 在 一 个 存 取 函数 中 给 出 了 数组 元 素 的 引用 与 这 个 元 素 的 地 址 之 
上 则 的 关系 ， 所 以 存 取 函数 是 一 种 映射 的 实现 。 数 组 可 以 为 静态 ， 如 在 C++ 中 的 数组 ， 这 种 数组 的 定义 中 包 
括 了 static 说 明 符 ， 也 可 以 为 固定 栈 动态 的 ， 如 C 中 的 函数 ( 它 不 具有 static 说 明 符 )， 还 可 以 为 栈 动态 
的 ， 如 在 Ada 中 的 块 ， 或 者 固定 堆 动态 的 ， 如 Java 的 对 象 ， 还 可 以 是 堆 动态 的 ， 如 在 Perl 中 的 数组 。 大 多 数 
的 语言 只 允许 少量 的 对 整个 数组 的 操作 。 

异 构 数 组 是 指 其 元 素 可 以 是 不 同类 型 的 数组 。 pial. Asasi. Python 和 Ruby 都 支持 异 构 数组 。 

记录 现在 已 经 被 包括 进 大 多 数 语言 中 。 记 录 的 域 通过 多 种 方式 来 说 明 。 在 COBOL 中 ， 可 以 引用 域 而 
并 不 需 提 及 所 有 包含 这 个 域 的 记录 ， 但 这 样 实现 起 来 十 分 散乱 ， 并 且 还 会 影响 可 读 性 。 在 Java 中 ， 记 录 由 
类 结构 支持 。 

联合 , 就 是 可 以 在 不 同 的 时 间 存 储 不 同类 型 值 的 地 址 。 判 别 的 联合 包括 了 一 个 记录 当前 类 型 值 的 标志 。 
自由 联合 是 一 种 没有 标志 的 联合 。 大 多 数 具 有 联合 的 语言 ， 除 了 Ada 语 言 以 外 ， 其 联合 设计 并 不 安全 。 

集合 常 弟 是 很 方便 的 ， 它 的 实现 也 相对 容易 。 然 而 ， 通 常 需 要 使 用 集合 的 那些 应 用 可 以 毫 无 困难 地 
由 其 他 数据 类 型 来 完成 。 

指针 可 增进 灵活 性 ， 并 控制 动态 存储 管理 。 指 针 具 有 一 些 内 在 的 危险 性 ， 难以 避免 悬挂 指针 ， 还 会 
出 现存 储 泄漏 。 

引用 类 型 ， 如 Java 中 的 引用 类 型 ， 可 以 提供 堆 管理 ， 但 不 具有 指针 的 危险 性 。 

实现 一 种 数据 类 型 的 难 易 程度 ， 对 这 种 类 型 能 否 被 包括 进 语言 极 具 影 响 。 枚 举 类 型 、 子 范围 类 型 和 
记录 类 型 都 相对 地 容易 实现 。 数 组 也 很 单纯 :尽管 当 数 组 具有 多 个 下 标 时 ， 存 取 数 组 元 素 有 很 高 的 代价 。 
存 取 国 数 需要 对 每 一 个 下 标 都 进行 一 次 加 法 和 乘法 运算 。 

如 采 不 考虑 堆 管理 ， 指 针 的 实现 也 相对 容易 。 如 果 所 有 单位 都 是 单一 大 小 的 ， 扒 管理 会 比较 容易 ， 
但 可 变 大 小 单位 的 分 配 及 解除 分 配 则 较为 复杂 。 


文献 注释 
在 关于 数据 类 型 的 设计 、 使 用 以 及 实现 方面 ， 有 着 极为 丰富 的 计算 机 科学 文献 。Hoare 在 (Dahl etal., 
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1972) 中 给 出 了 最 早期 结构 化 类 型 的 系统 定义 。Cleaveland (1986) 给 出 了 对 种 类 广泛 的 数据 类 型 的 一 般 性 
讨论 。 

Fischer 和 LeBlanc (1980) 讨 论 了 对 Pascal 数 据 类 型 可 能 具有 的 非 安 全 性 实现 运行 时 检测 。 大 多 数 关于 编 
译 袁 设计 的 书 ， 如 Fischer 和 LeBlanc 的 专著 (1988)， 以 及 Aho 等 人 的 专著 (1986)， 都 描述 了 数据 类 型 的 实现 
万 法 ，Pratt 和 Zelkowitz 所 著 的 程序 设计 语言 教程 (2001)， 以 及 Scott 所 著 的 教程 (2000) 也 都 给 出 了 数据 类 
型 的 实现 方法 。 关 于 堆 管 理 问 题 的 详细 讨论 ， 可 以 在 Tenenbaum et al. (1990) 中 找到 。 垃圾 收集 方法 由 
Schorr 和 Waite (1967) 以 及 Deutsch 和 Bobrow (1976) 开发 。 天 于 垃圾 收集 算法 的 全 面 讨论 ， 可 以 在 
Cohen (1981) 以 及 Wilson (2005) 文献 中 找到 。 
复习 题 
1. 什么 是 描述 符 ? 
2. 小 数 数据 类 型 具有 什么 优点 和 缺点 ? 
3. 字 符 串 类 型 的 设计 问题 是 什么 ? 
4. 摘 述 串 长 度 的 三 种 选择 。 
5. 定义 序数 类 型 、 枚 举 类 型 和 子 范 围 类 型 
6. 用户 定义 的 枚 举 类 型 有 什么 优点 ? 
7.C# 中 用 户 定义 的 枚 举 类 型 在 哪些 方面 比 C++ 中 的 枚 举 类 型 可 靠 程度 更 高? 
8. 数组 有 哪些 设计 问题 ? 


”定义 静态 数组 、 固 定 栈 动态 数组 、 栈 动态 数组 、 固 定 堆 动态 数组 以 及 堆 动态 数组 。 每 _ 种 数组 各 有 什 


么 优点 ? 
10. 什么 是 异 构 数组 ? 
11. 当 在 Perl 中 引用 一 个 不 存在 的 数组 元 素 时 会 发 生 什 么 ? 
12. JavaScript 怎 样 支持 松散 数组 ? 
13. 什么 语言 支持 负 下 标 ? 
14. 什么 语言 支持 带 有 步 长 的 数组 片 ? 
15. 在 Ada 中 的 哪些 数组 初始 化 特性 在 其 他 一 般 命 令 式 语言 中 不 存在 ? 
16. 什么 是 聚集 常量 ? 
17. 什么 样 的 数组 操作 是 专门 为 Ada 中 的 一 维 数组 而 提供 的 ? 
18. Fortran 95 中 的 片 与 Ada 中 的 片 有 什么 不 同 ? 
19. 定义 按 行 存放 和 按 列 存放 。 
20. 数组 的 存 取 函数 是 什么 ? 
“Java 中 的 数组 描述 符 要 求 的 项 是 什么 ? 必须 在 什么 时 候 将 它们 储存 (是 在 编译 时 ， 还 是 在 运行 时 )。 
22. COBOL 中 记录 的 层 号 的 目的 是 什么 ? 
23. 对 于 记录 中 的 域 ， 定 义 完全 限定 引用 及 省 略 引 用 
24. 定义 联合 、 自 由 联合 以 及 判别 的 联合 。 
25. 天 于 联合 的 设计 问题 是 什么 ? 
26. 通 弟 总 是 对 Ada 中 的 联合 进行 类 型 检测 吗 ? 
27. 天 于 指针 类 型 有 哪些 设计 问题 ? 
28. 指针 具 有 的 两 个 普遍 问题 是 什么 ? 
29. 为 什么 大 多 数 语言 中 的 指针 都 被 限制 于 只 能 够 指向 一 种 类 型 的 变量 2 
30. 什么 是 C+t+ 的 引用 类 型 ? 它 有 哪些 普遍 应 用 ? 
31. 为 什么 将 C++ 中 的 引用 变量 用 于 形 参 时 比 使 用 指针 更 好 ? 
32. Java 以 及 C# 中 的 引用 类 型 变量 具有 什么 超越 其 他 语言 中 的 指针 的 优点 ? 
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33. fi HLT SEY HET ARTE 
34. 为 什么 对 Java 及 C# 中 的 引用 施行 算术 运算 没有 意义 ? 


练习 题 


1. 支 持 与 反对 在 存储 空间 将 布尔 值 表 示 为 单个 位 的 论点 各 是 什么 ? 

2. 为 什么 小 数值 浪费 存储 空间 ? 

.VAX 小 型 计算 机 使 用 一 种 不 同 于 IEEE 标 准 的 浮 点 数 格式 。 这 种 格式 是 什么 ”为 什么 YAX 计 算 机 的 设计 
人 员 选 择 了 这 种 格式 ?关于 VAX 浮 点 数 的 表示 可 以 参考 文献 (Sebesta，1991)。 

. 从 安全 性 和 实现 代价 的 角度 ， 对 墓碑 以 及 锁 一 钥匙 两 种 避免 甚 挂 指针 的 方法 进行 比较 。 

指针 的 隐 式 间接 引用 存在 什么 缺点 ? 这 些 缺 点 仅仅 在 某 些 特定 情形 下 才 产 生 吗 ? 例如， 考虑 Ada 中 一 

个 指向 记录 的 指针 的 隐 式 间接 引用 ， 当 使 用 这 个 指针 来 引用 一 个 记录 的 域 时。 

解释 子 类 型 与 派生 类 型 之 间 的 所 有 差别 。 

C 与 C++ 中 对 -> 操作 符 的 使 用 有 哪些 主要 的 辩解 ? 

列举 C++ 中 的 枚 举 类 型 与 Java 中 的 枚 举 类 型 之 间 的 所 有 不 同 。 

C 和 C++ 中 的 联合 与 这 些 语言 中 的 记录 是 分 开 的 ， 而 不 像 在 Ada 中 那样 ， 这 两 者 是 结合 在 一 起 的 。 这 两 

种 不 同 的 设计 选择 分 别 具 有 什么 优点 和 缺点 ? 

10. 可 以 使 用 按 行 存放 的 方法 来 储存 多 维 数组 ， 如 在 C++ 中 那样 ， 也 可 以 使 用 按 列 存放 的 方法 ， 如 在 
Fortran 中 那样 。 请 为 以 上 这 两 种 存放 方法 开发 三 维 数组 的 存 取 函 数 。 

11. 在 Burroughs 扩 展 的 ALGOL 语 言 中 ， 将 矩阵 储存 为 指针 的 一 维 数组 ， 放 置 于 矩阵 的 行 ， 因 此 能 够 将 它们 
像 数值 的 一 维 数组 一 样 来 处 理 。 这 种 方案 具有 什么 样 的 优点 及 缺点 ? 

.分 析 并 且 写 出 C 中 的 malloc 和 free 函 数 与 C++ 中 的 new 和 delete 操 作 符 的 比较 。 将 安全 性 作为 比较 中 
的 主要 考虑 因素 。 

.分 析 并 且 写 出 使 用 C++ 中 的 指针 ， 以 及 使 用 Java 中 的 引用 变量 ， 来 引用 堆 动 态 变 量 之 间 的 比较 。 将 安全 
性 以 及 方便 性 作为 比较 中 的 主要 考虑 因素 。 

14. Java 的 设计 人 员 没 有 将 C++ 的 指针 包括 进来 ， 针 对 这 种 设计 决定 写 出 一 段 关 于 这 种 决策 的 得 失 的 简短 讨论 。 

15. 当 比 较 C++ 中 所 要 求 的 显 式 堆 存储 空间 的 回收 时 ， 支 持 与 反对 Java 中 隐 式 堆 存 储 空 间 回 收 的 论点 各 是 什么 ? 

16. 支持 在 C# 语 言 中 包括 枚 举 类 型 的 论点 是 什么 ?尽管 在 Java 语 言 早期 的 一 些 版 本 中 ， 并 没有 包括 枚 举 类 型 。 

17. 你 期 待 应 该 将 C# 语 言 中 的 指针 使 用 保持 在 什么 样 的 程度 ? 当 并 不 是 绝对 需要 指针 时 ， 应 该 经 常 使 用 它 
们 吗 ? 

.产生 两 列 关 于 和 矩阵 的 应 用 ， 其 中 的 一 列 要 求 参 差 的 矩阵 ， 男 一 列 则 要 求 长 方形 矩阵 。 现 在 请 给 出 理由 
来 说 明 ， 在 程序 设计 语言 中 ， 是 否 只 应 该 包括 参差 的 矩阵 ， 或 者 只 应 该 包括 长 方形 和 矩阵， 或 者 应 该 包 
括 这 两 种 类 型 的 矩阵 ? 

19. 比较 C++，Java 以 及 C# 中 的 类 库 进 行 串 处 理 的 功能 ， 它 们 有 什么 差别 ? 


程序 设计 练习 题 


1. 设 计 一 组 简单 的 测试 程序 ， 以 确定 你 使 用 的 一 个 C 编 译 器 的 类 型 兼容 规则 。 并 且 将 你 的 发 现 写 和 你 的 
报告 中 。 

2. 确定 你 使 用 的 一 些 C 编 译 器 是 否 实现 了 free 函 数 。 

3. 使 用 某 种 语言 编写 一 个 矩阵 乘法 程序 ， 要 求 这 种 语言 进行 下 标 范围 的 检测 ， 并 且 你 还 可 以 从 它 的 编译 
络 获 得 汇编 语言 或 者 机 器 语言 的 版 本 。 确 定 进行 这 种 下 标 范 围 检 测 所 必需 的 指令 数目 ， 并 且 将 这 个 数 
目 与 矩阵 乘法 程序 中 的 总 指令 数 进行 比较 。 

4. 如 果 你 曾经 使 用 过 一 个 编译 器 ， 在 其 中 用 户 可 以 说 明 是 否 需 要 进行 下 标 范 围 的 检测 ， 编 写 一 个 进行 大 
量 矩 阵 的 存 取 并 且 记 录 执 行 时 间 的 程序 。 在 具有 下 标 范 围 检 测 与 没有 这 种 检测 的 情形 下 运行 这 个 程序 ， 
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比较 各 目的 执行 时 间 。 

5. 用 C++ 语言 编写 一 个 简单 程序 ， 来 检测 枚 举 类 型 的 安全 性 。 至 少 要 包括 10 个 针对 枚 举 类 型 的 操作 ， 以 
确定 什么 样 的 错误 或 愚蠢 行为 会 是 合法 的 。 然 后 再 编写 一 个 执行 同样 任务 的 C# 程 序 ， 并 运行 这 个 CH 
程序 ， 以 确定 有 多 少 错误 、 或 思春 行为 是 合法 的 。 比 较 你 的 结果 。 

6. 使 用 C++ 或 C# 语 言 来 编写 一 个 程序 ， 这 个 程序 要 包括 两 种 不 同 的 枚 举 类 型 ， 还 包括 大 量 的 枚 举 类 型 操 
作 。 再 编写 一 个 仅 使 用 整数 变量 的 同样 程序 。 比 较 它 们 的 可 读 性 ， 并 预测 这 两 种 程序 在 可 靠 性 方面 的 
差别 。 

7. 编 写 一 个 C 程 序 ， 这 个 程序 将 仅 通过 下 标 来 大 量 引 用 二 维 数组 中 的 元 素 。 再 编写 第 二 个 程序 ， 这 个 程 
序 将 进行 同样 的 操作 ， 然 而 是 通过 使 用 指针 以 及 用 于 储存 映射 函数 的 指针 的 运算 来 进行 数组 的 引用 。 
这 两 个 程序 哪 一 个 更 可 靠 ? 为 什么 ? 

8. 编写 一 个 使 用 散 列 并 在 散 列 上 施行 大 量 操作 的 Perl 程 序 。 例 如 ， 这 种 散 列 可 以 储存 人 的 姓名 与 年 龄 。 可 
以 使 用 一 个 随机 数 生成 器 来 产生 3 个 字符 的 名 字 及 年 龄 ， 并 将 这 些 新 的 名 字 及 年 龄 加 入 到 散 列 中 。 当 产 
生 了 一 个 重复 的 名 字 时 ， 它 只 会 导致 对 散 列 的 存 取 ， 但 不 会 增加 新 的 元 素 。 重 新 编写 这 个 程序 ， 但 这 
一 次 不 使 用 散 列 。 比 较 这 两 个 程序 的 执行 效率 ， 比 较 这 两 种 程序 的 难 易 程度 ， 以 及 它们 的 可 读 性 。 
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正如 本 章 标题 所 示 ， 这 一 章 的 重点 是 关于 表达 式 和 赋值 语句 。 我 们 将 首先 讨论 决定 表达 式 
中 操作 符 的 计算 顺序 的 语义 规则 。 紧 接着 ， 将 讨论 当 函 数 具 有 副作用 时 操作 数 求 值 顺序 中 的 潜 
在 问题 。 然 后 再 讨论 预定 义 和 用 户 定义 的 两 种 重 载 操作 符 ， 以 及 这 两 种 操作 符 对 程序 中 表达 式 
的 影响 。 接 下 来 将 讨论 与 评估 混合 模式 的 表达 式 。 这 种 讨论 导致 了 宽 化 及 穿 化 类 型 转换 的 定义 ， 
包括 使 用 隐 式 与 显 式 两 种 方式 。 然 后 还 将 讨论 关系 表达 式 和 布尔 表达 式 ， 其 中 包括 短路 求 值 的 
思想 。 最 后 将 讨论 的 是 赋值 语句 ， 包 括 从 它 的 最 简单 形式 到 它 的 所 有 变 体 ， 还 包括 赋值 语句 作 
为 表达 式 以 及 混合 模式 的 赋值 。 

这 一 章 仅 限于 讨论 命令 式 语 言 中 的 表达 式 和 赋值 语句 。 关 于 函数 式 语言 和 逻辑 语言 中 的 表 
达 式 说 明 与 求 值 问 题 ， 将 分 别 在 第 15 章 和 第 16 章 进行 讨论 。 | 

关于 字符 串 的 模式 匹配 表达 式 ， 曾 经 在 第 6 章 作为 字符 串 的 一 部 分 讨论 过 ， 因 而 本 章 不 再 讲 
述 它 们 。 


7.1 概述 


在 程序 设计 语言 中 ， 表 达 式 是 说 明 计算 的 基本 方式 。 理 解 正在 使 用 语言 的 表达 式 的 语法 及 
语义 对 于 程序 员 十 分 关键 。 我 们 曾经 在 第 3 章 里 讲述 过 一 种 形式 描述 表达 式 语 法 的 方法 (BNF), 
在 这 一 章 里 ， 我 们 的 注意 力 将 集中 在 由 表达 式 的 求 值 方式 所 决定 的 表达 式 语义 ， 也 即 表达 式 的 
意义 是 什么 。 

要 理解 表达 式 的 求 值 ， 就 必须 熟悉 操作 符 和 操作 数 运算 的 顺序 。 表 达 式 操作 符 的 运算 顺序 
服从 语言 的 结合 性 以 及 优先 级 规则 。 虽 然 表 达 式 的 值 经 常 依 赖 于 这 种 顺序 ， 但 语言 的 设计 人 员 
第 第 并 不 说 明 表 达 式 中 操作 数 的 求 值 顺 序 。 这 就 允许 语言 的 实现 人 员 进 行 顺序 的 选择 ， 从 而 导 
致 一 些 程序 可 能 在 不 同 的 实现 中 产生 不 同 的 结果 。 表 达 式 语义 上 的 其 他 问题 还 包括 类 型 的 错误 
匹配 、 强 制 转换 以 及 短路 求 值 。 

命令 式 程 序 设计 语言 的 实质 是 赋值 语句 占据 主导 地 位 。 赋 值 语句 的 目的 是 改变 变量 的 值 。 
因而 所 有 命令 亏 语 言 的 共同 部 分 就 是 在 程序 的 执行 期 间 改变 变量 的 值 的 概念 ( 非 命令 式 语 言 
时 会 包括 一 系列 不 同 种 类 的 变量 ， 如 函数 式 语 言 中 的 函数 参数 ) 。 

向 单 的 赋值 语句 指明 一 条 将 被 计算 的 表达 式 和 一 个 放置 表达 式 计算 结果 的 目标 位 置 。 如 本 
章 将 要 讲 到 的 ， 还 存在 许多 基于 这 种 基本 形式 的 变化 形式 。 


7.2 算术 表达 式 


与 数学 、 科 学 和 工程 表达 式 相 类 似 的 算术 表达 式 的 自动 求 值 是 第 一 种 高 级 程序 设计 语言 的 
主要 目标 之 一 。 程 序 设计 语言 中 算术 表达 式 的 大 部 分 特征 都 来 自 数 学 中 的 传统 形式 ， 其 中 包括 
了 操作 符 、 操 作 数 、 括 号 以 及 函数 调用 。 操 作 符 可 以 是 一 元 的 (unary) ， 这 意味 着 这 些 操作 符 
只 具有 一 个 操作 数 ,也 可 以 是 二 元 的 (binary)， 即 它们 具有 两 个 操作 数 。 第 7.2.1.4 节 中 将 要 讲 到 ， 
基于 C 的 语言 还 包括 了 一 个 三 元 (ternary) 操作 符 ， 它 则 具有 三 个 操作 数 。 

在 大 多 数 命令 式 程序 设计 语言 中 的 二 元 操作 符 是 中 辍 的 , 这 意味 着 这 些 二 元 操作 符 出 现在 它 


们 的 操作 数 之 间 。 但 Perl 语 言 是 一 个 例外 ， 它 的 一 些 操 作 符 是 前 组 的 ， 这 意味 着 这 些 操 作 符 位 
于 它们 的 操作 数 之 前 。 

算术 表达 式 的 目的 是 要 说 明 一 种 算术 运算 。 这 种 运算 的 实现 必 将 产生 两 个 动作 : 通常 是 从 
存储 右 中 获取 操作 数 ， 并 在 这 些 操作 数 上 执行 这 个 算术 运算 。 在 下 面 的 几 节 中 ， 我 们 将 研究 命 
令 式 语 言 中 算术 表达 式 的 一 般 设 计 细 市 。 

下 面 是 关于 算术 表达 式 的 主要 设计 问题 ， 所 有 这 些 内 容 都 会 在 本 节 讨 论 : 

“什么 是 操作 符 的 优先 级 规则 ? 

“什么 是 操作 符 的 结合 性 规则 ? 

“什么 是 操作 数 的 求 值 顺序 ? 

“对 操作 数 求 值 运算 的 副作用 进行 限制 吗 ? 

“这 些 语言 允许 用 户 定义 的 操作 符 重 载 吗 ? 

* 在 表达 式 中 允许 什么 样 的 混合 模式 ? 


7.2.1 操作 符 求 值 顺序 


我 们 首先 来 研究 指定 操作 符 求 值 顺序 的 一 些 语言 规则 。 
7.2.1.1 优先 级 
表达 元 的 值 至 少 部 分 取决 于 表达 式 中 操作 符 的 求 值 顺序 。 考 虑 下 面 的 表达 式 ; 


atb*te 


设想 变量 a、b 和 c 分 别 具 有 值 3、4 和 5。 如 果 是 从 左 到 右 计 算 ( 先 加 法 ， 后 乘法 ) ， 其 结果 
征 35， 但 如 果 是 从 右 到 左 计 算 ， 其 结果 则 是 23。 

除了 仅仅 是 从 左 到 右 或 者 从 右 到 左 的 计算 顺序 ， 数 学 家 们 还 开发 了 这 样 一 种 概念 ， 即 按照 
计算 优先 级 别 的 层次 来 放置 操作 符 ， 并 且 表 达 式 的 计算 顺序 将 部 分 按照 这 种 层次 差别 。 例 如 在 
数学 中 ， 认 为 乘法 比 加 法 具有 更 高 的 优先 级 别 ， 也 许 由 于 它 有 更 高 的 复杂 度 。 如 果 在 上 面 表达 
式 的 例子 中 ， 我 们 参照 这 种 传统 的 话 ， 则 会 首先 计算 乘法 。 

表达 式 计 算 的 操作 符 优 先 级 规则 定义 了 对 不 同 优先 级 的 操作 符 进行 计算 的 顺序 。 从 语言 设 
计 人 员 的 观点 来 看 ， 表 达 式 的 操作 符 优先 级 规则 是 以 操作 符 的 优先 级 别 的 层次 为 基础 的 。 在 一 
役 的 命令 式 语 言 中 ， 操 作 符 的 优先 级 规则 几乎 都 是 相同 的 ， 因 为 它们 都 是 基于 数学 中 的 优先 级 
规则 。 在 这 些 语 言 中 ， 乘 需 具 有 最 高 的 优先 级 ( 当 语言 提供 乘客 操作 时 )， 后 面 接 着 是 同 在 一 个 
层次 上 的 乘法 和 除法 ， 再 接着 是 同一 个 层次 上 的 二 元 加 法 与 二 元 减法 。 

许多 语言 还 包括 了 加 法 与 减法 的 一 元 版 本 。 一 元 加 法 也 被 称 为 恒 等 操 作 符 ， 因 为 它 通 常 并 
不 具有 相关 的 操作 ， 因 此 对 其 操作 数 不 产 生 影响 。Ellis 和 Stroustrup 在 论述 C++ 时 ， 将 一 元 加 法 
称 为 是 一 个 历史 性 的 意外 ， 并 将 它 明白 无 误 地 标记 为 是 无 用 的 (Ellis and Stroustrup,1990, p.56), 
在 Java 和 C# 语 言 中 ， 当 一 元 加 法 的 操作 数 为 short 或 byte 类 型 时 ， 就 会 使 这 些 操作 数 被 隐 式 地 
转换 为 int 类 型 ， 因 而 这 种 一 元 加 法 实际 上 还 是 有 影响 的 。 当 然 ， 一 元 减法 总 是 改变 其 操作 数 
的 符号 。 在 Java 和 C# 中 ， 一 元 减法 也 会 引起 short 和 byte 操 作 数 被 隐 式 地 转换 为 int 类 型 ， 

在 所 有 的 常用 命令 式 语言 中 ， 一 元 减法 操作 符 可 以 出 现在 表达 式 的 开头 ， 或 者 表达 式 中 的 
任意 位 置 上 ， 但 需要 对 它 加 上 括号 以 避免 它 与 另 一 个 操作 符 相 毗 邻 。 例 如 ， 

A+ (t= BC 

是 合法 的 ， 但 是 


A+-B*C 
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则 通常 不 合法 。 
接着 ， 考 虑 下 面 的 表达 式 : 
-A / B 
-A * B 
=A. Xk B 


在 前 两 个 例子 中 ， 一 元 减 操 作 符 和 二 元 操作 符 的 相对 优先 级 是 不 相关 的 一 一 两 个 操作 符 的 
求 值 顺序 对 表达 式 的 值 没 有 影响 。 然 而 ， 在 最 后 一 个 例子 中 ， 它 却 产 生 了 麻烦 。 在 第 用 程序 设 
计 语 言 中 ， 只 有 Fortran、Ruby、Visual Basic 和 Ada 有 乘 需 操 作 符 。 在 4 种 语言 中 ， 乘 徊 有 比 一 元 
减 更 高 的 优先 级 ， 因 此 

aA xe B 

等 价 于 

-(A ** B) 

在 有 种 情况 下 ， 一 元 操作 符 的 优先 级 是 迷惑 的 . Ada 中 一 元 减 的 优先 级 比 mod 低 ， 因 此 表达 式 

-17 mod 5 

等 价 于 

= (17 mod 5) 

计算 结果 是 -2， 而 不 是 3 (如 果 一 元 减 的 优先 级 高 于 mod) ， 基于 C 的 语言 也 会 得 到 这 个 结果 。 

少数 几 种 常用 程序 设计 语言 中 的 算术 操作 符 的 优先 级 列举 如 下 ， 


Ruby 基于 C 的 语言 Ada 
最 高 优先 级 x 后 办 ++, -- **, abs 
ae J AUR ++, --, 一 元 +, - *, /, mod, rem 
所 有 +, - ny tay A J Wy, 
最 低 优 先 级 < es. ey t S 


“ 征 乘 寡 操作 符 。C 中 的 s 操 作 符 与 Ada 中 的 zxem 操 作 符 十 分 类 似 ; 它 具 有 两 个 整数 操作 数 ， 
并 产生 第 一 个 整数 被 第 二 个 整数 相 除 以 后 的 余数 。9 当 两 个 操作 数 都 为 正 数 时 ， Ada 中 的 mod 操 
作 符 与 rem 操 作 符 完全 一 样 。 但 是 当 有 一 个 或 者 两 个 操作 数 为 负数 时 ， 这 两 个 操作 符 就 不 相同 。 
关于 C 中 的 ++ 和 -- 操作 符 ， 将 在 第 7.7.4 节 进行 描述 。Ada 中 的 abs 操 作 符 是 一 个 一 元 操作 符 ， 
它 产 生 其 操作 数 的 绝对 值 。 

AFL 在 语言 中 是 个 例外 ， 因 为 如 同 下 面 小 节 将 要 介绍 的 ， 它 只 具有 单个 级 别 的 优先 级 。 

优先 级 只 是 操作 符 运算 顺序 规则 中 的 一 个 部 分 ， 结 合 性 规则 也 影响 着 操作 符 的 运算 顺序 。 

1.2.1.2 结合 

考虑 下 面 的 表达 式 ; 


a=-b+t+ce-dqd 


如 采 表 达 式 中 的 加 法 操作 符 与 减法 操作 符 具 有 同样 的 优先 级 ， 优先 级 规则 对 于 这 个 表达 式 
中 操作 符 的 运算 顺序 就 不 起 任何 作用 。 

当 一 个 表达 式 包 含 了 两 个 相 邻 出现 、 具 有 同样 优先 级 的 操作 符 时 ， 先 计算 哪个 操作 符 是 
由 语言 的 结合 性 规则 来 决定 。 一 个 操作 符 可 以 具有 左 结合 性 或 右 结合 性 ， 它 们 分 别 表示 ， 先 计 


O 在 C99 之 前 的 C 版 本 中 ，% 操 作 符 在 某 些 情况 下 是 依赖 于 实现 的 ， 因为 除法 本 身 也 是 依赖 于 实现 的 。 
O 如 打 一 些 操作 符 之 间 由 单个 操作 数 分 隔 ， 我 们 称 这 些 操作 符 是 “ 相 邻 ”的 。 


算 最 左边 出 现 的 操作 符 ， 或 者 先 计算 最 右边 出 现 的 操作 符 。 
常用 的 命令 式 语 言 中 的 结合 性 是 从 左 到 右 的 ， 只 有 乘 才 操作 符 〈( 当 提供 乘客 操作 时 ) 是 从 
右 到 左 结合 的 。 在 下 面 的 Java 表 达 式 
a- b+C 
中 ， 先 计算 左边 的 操作 符 。 但 Fortran 和 Ruby 中 的 乘 索 是 右 结合 的 , 因而 在 表达 式 
A ** B ** C 
中 ， 先 计算 右边 的 操作 符 。 
Ada 中 的 乘 瑚 是 非 结合 的 ， 这 意味 表达 式 
A ** B xx C 
在 Ada 中 是 不 合法 的 。 必 须 给 这 种 表达 式 加 上 括号 ， 以 明确 表示 求 值 顺序 ， 就 像 下 面 的 表 
达 式 
(A ** B) ** œ 
或 者 
A ** (B ** C) 
在 Visual Basic 中 的 乘 寡 操作 符 “^” 是 左 结合 的 。 
下 面 给 出 一 些 最 常用 的 命令 式 语 言 的 结合 性 规则 : 


语言 结合 性 规则 
Ruby Hee *, /, +, = 
A: k* 
基于 C 的 语言 Te = f Sn t E = 
AG: tF, ey = sa = + 
Ada Fe: 除了 ** 之 外 的 所 有 操作 符 
非 结 合 的 : ** 


如 在 7.2.1 市 中 曾经 说 明 的 ， 在 APL 中 ， 所 有 的 操作 符 都 具有 相同 级 别 的 优先 级 。 因 而 在 
APL 表 达 式 中 ， 操 作 符 的 运算 顺序 完全 由 结合 性 规则 来 决定 , 在 这 些 规则 中 ， 所 有 的 操作 符 都 是 
从 右 到 左 结合 的 。 例 如 ， 在 表达 式 


A X B+C 


中 ， 先 计算 加 法 操作 符 ， 然 后 才 计算 乘法 操作 符 ( x ) 是 APL 中 的 乘法 操作 符 。 如 果 A 是 3，B 
是 4 ，C 是 5， 那 么 这 条 APL 表 达 式 的 值 是 27。 

对 于 常用 命令 式 语 言 ， 许 多 编译 器 都 利用 这 样 一 种 事实 ， 即 一 些 算术 操作 符 是 数学 结合 的 ， 
这 意味 着 ,结合 性 规则 对 于 仅 包 括 算术 操作 符 的 表达 式 的 值 没有 影响 。 例 如 ， 加 法 是 数学 结合 
的 , 因此 在 数学 上 ， 表 达 式 


A 二 有 十 站 


的 值 并 不 取决 于 操作 符 的 运算 顺序 。 如 果 数 学 结合 操作 的 浮 点 操作 也 是 结合 的 话 , 编译 器 就 可 以 
利用 这 个 事实 进行 一 些 简单 优化 。 尤 其 是 ， 如 果 允 许 编译 器 对 操作 符 的 运算 重新 排序 ， 它 也 许 
可 以 为 表达 式 运 算 产 生 更 快速 的 代码 。 事 实 上 ， 编 译 器 的 确 会 进行 这 类 优化 ，。 

然而 不 垃 的 是 ， 在 计算 机 中 ， 浮 点 表示 法 以 及 浮 点 算术 操作 都 只 是 数学 的 近似 (因为 大 小 
限制 )。 数 学 操作 符 是 结合 的 ， 这 并 不 一 定 就 意味 着 与 其 对 应 的 浮 点 操作 也 是 结合 的 。 事实 上 ， 
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只 有 当 所 有 的 操作 数 以 及 中 间 结 果 都 可 以 使 用 浮 点 标记 准确 地 表示 时 ， 这 样 的 过 程 才 严 格 地 为 
结合 的 。 例 如 ， 在 有 些 非 正 常情 形 下 ， 计 算 机 上 的 整数 加 法 都 不 是 结合 的 。 如 ， 假 设 有 一 个 程 
序 必 须 计算 下 面 的 表达 式 

A. +r BS So += D 

在 这 里 ，A 和 C 为 非常 大 的 正 数 ， 而 B 和 D 为 绝对 值 非常 大 的 负数 。 在 这 种 情况 下 ， 将 B 加 入 R 
不 会 引起 溢出 ， 但 是 将 cC 加 入 & 则 会 引起 。 同 样 地 ， 将 C 加 入 B 不 会 引起 溢出 ， 但 是 将 D 加 入 B 则 会 
引起 。 因 为 计算 机 算术 的 限制 ， 在 这 种 情况 下 的 加 法 是 非 结 合 的 。 因 此 ， 如 果 编 译 姓 将 这 些 加 
法 操作 重新 排序 ， 就 会 影响 表达 式 的 值 。 当 然 ， 如 果 假 设 变量 的 近似 值 是 已 知 的 ， 程 序 人 员 就 
可 以 避免 这 个 问题 。 程 序 人 员 只 需要 给 表达 式 加 括号 ， 以 便 确保 只 进行 安全 顺序 的 计算 。 然 而 ， 
这 些 情形 有 时 可 能 以 非常 微妙 的 方式 出 现 ， 那 么 程序 人 员 多 半 就 不 会 注意 到 这 种 顺序 的 依赖 性 。 

7.2.1.3 括号 

程序 人 员 可 以 通过 在 表达 式 中 放置 括号 来 改变 优先 级 规则 以 及 结合 性 规则 。 表 达 式 中 加 括 
号 的 部 分 比 相 邻 的 没有 加 括号 的 部 分 具有 更 高 的 优先 级 。 例 如 ， 尽 管 乘法 比 加 法 优先 , 但 在 表 
ATK 

(A + B) * C | 
中 ， 将 先进 行 加 法 运算 。 这 在 数学 上 是 十 分 自然 的 。 在 这 个 表达 式 中 ， 乘 法 操作 符 的 第 一 个 操 
作 数 ， 必 须 在 括号 中 的 子 表达 式 进 行 加 法 运算 之 后 才能 够 被 求 值 。 第 7.2.1.2 节 的 表达 式 指定 为 

(A + B) + (e + D) 
LA aE 6 int EH o 

允许 在 算术 表达 式 中 使 用 括号 的 语言 可 以 省 却 所 有 的 优先 级 规则 ， 只 需要 将 所 有 操作 符 从 
左 到 右 或 者 从 右 到 左 地 结合 。 程 序 人 员 会 使 用 括号 指明 所 需要 的 计算 顺序 。 这 种 方法 十 分 简单 ， 
因为 无 论 是 程序 的 编写 人 员 还 是 阅读 人 员 ， 都 不 需要 记 住 任何 优先 级 规则 或 结合 性 规则 。 这 种 
方案 的 缺点 是 表达 式 的 书写 比较 麻烦 ， 也 会 严重 地 降低 代码 的 可 读 性 。 然 而 这 正 是 APL 语 言 的 
设计 人 员 Ken Iverson 做 出 的 选择 。 

7.2.1.4 ” Ruby 表达 式 

回顾 一 下 ，Ruby 是 一 种 完全 面向 对 象 的 语言 ， 这 意味 着 包括 字面 常量 在 内 的 每 个 数据 值 都 
是 对 象 。Ruby 支 持 很 多 包括 基于 C 的 语言 的 算术 和 逻辑 运算 。 在 表达 式 方 面 使 Ruby 和 基于 C 的 
语言 区 分 开 来 的 内 容 是 ， 所 有 算术 、 关 系 和 赋值 运算 符 ， 以 及 数组 索引 、 移 位 和 位 逻辑 运算 符 
都 是 用 方法 实现 的 。 例 如 ， 表 达 式 a+b 是 一 个 对 a 引用 对 象 的 + 方法 的 调用 ， 并 传递 b 引 用 的 对 
象 作 为 参数 。 

一 个 把 运算 符 实 现 为 方法 的 有 趣 的 结果 是 它们 都 被 应 用 程序 重 写 。 然 而 ， 这 些 运算 符 能 
新 定义 。 为 预定 义 类 型 重新 定义 运算 符 是 没有 用 的 ， 而 正在 第 7.3 节 所 描述 的 ， 为 用 户 定义 类 型 
定义 预定 义 运 算 符 才 是 有 用 的 ， 这 在 某 些 语言 中 可 以 通过 运算 符 重 载 来 完成 。 

7.2.1.5 条 件 表达 式 

我 们 现在 来 看 看 三 元 操作 符 ?: ， 它 被 包括 在 基于 C 的 语言 中 。 这 个 操作 符 被 用 来 建立 条 件 

有 时 候 我 们 使 用 if-then-else 语 句 来 执行 一 种 条 件 表达 式 语句 。 例 如 下 面 的 语句 ， 

if (count == 0) 

average = 0; 


else 
average = sum / count; 


在 基于 C 的 语言 中 ， 可 以 方便 地 在 赋值 语句 中 使 用 条 件 表达 式 来 说 明 上 面 的 这 种 运算 。 这 
条 语句 将 具有 下 面 的 形式 : 

表达 式 1 2? REA : REA 

在 这 里 ,“ 表 达 式 _1” 被 解释 为 布尔 表达 式 。 如 果 “ 表 达 式 _1 的 结果 为 真 ， 则 整个 表达 去 
的 值 就 是 “表达 式 _2 ”的 值 ， 否则 ， 它 就 是 “表达 式 _3 ”的 值 。 例 如 ， 上 面 的 if-then-else 
语句 可 以 通过 在 下 面 的 赋值 语句 中 使 用 条 件 表达 式 来 实现 : 

average = (count == 0) ? 0 : sum / count; 

在 效果 上 ， 问 号 标志 着 then 子 句 的 开始 ， 冒 号 则 标志 着 else 子 句 的 开始 。 这 两 个 子 句 都 
是 强制 性 的 。 注 意 ， 这 里 将 ? 作为 一 个 三 元 操作 符 用 于 条 件 表达 式 。 

可 以 将 条 件 表达 式 用 于 程序 中 任何 可 以 使 用 其 他 表达 式 的 位 置 (在 基于 C 的 语言 中 ) 。 包 括 
基于 C 的 语言 ，Perl、JavaScript 和 Ruby 提 供 了 条 件 表 达 式 。 


7.2.2 操作 数 求 值 顺序 


操作 数 的 求 值 顺序 是 一 种 通常 较 少 被 讨论 的 表达 式 设 计 特 征 。 表 达 式 中 变量 的 求 值 是 通过 
从 存储 器 中 获取 变量 的 值 来 进行 的 。 有 时 也 以 同样 的 方式 进行 常量 的 求 值 。 在 其 他 情况 下 ， 常 
量 可 能 是 机 器 语言 指令 的 一 部 分 ， 并 不 需要 从 存储 器 取得 。 如 果 一 个 操作 数 是 一 个 被 加 上 括号 
的 表达 式 ， 那 么 在 括号 中 包括 的 所 有 操作 符 必 须 在 其 值 可 以 被 作为 操作 数 使 用 之 前 就 完成 计算 。 

如 采 一 个 操作 符 的 两 个 操作 数 都 没有 副作用 ， 那 么 操作 数 的 求 值 顺序 是 无 所 谓 的 。 因 此 ， 
只 有 当 操 作 数 的 求 值 确实 存在 副作用 时 才 会 产生 有 趣 的 情形 。 

7.2.2.1 副作用 

当 函 数 改 变 它 的 一 个 参数 或 者 一 个 全 局 变量 时 ， 就 会 产生 函数 的 副作用 (或 函数 副作用 )。 
(全 局 变量 是 被 声明 于 函数 之 外 ,但 可 以 在 函数 中 访问 的 变量 。) 

考虑 下 面 的 表达 式 


a + fun (a) 


如 采 fun 在 a 变 更 时 没有 副作用 ， 那 么 操作 数 a 和 


fun(a) 的 求 值 顺序 不 会 影响 表达 式 的 值 。 然 而 ， 如 果 fun a 
在 a 改变 时 具有 副作用 ， 则 表达 式 的 值 会 有 影响 。 考 虑 下 面 pe pe e 
的 情形 : fun 返 回 10， 并 且 改 变 其 参数 值 为 0。 假 设 我 们 有 的 解决 方案 。Fortran 77 的 定义 声 
a = Lop 明 : 只 有 当 函 数 不 改 变 表达 式 中 
iiih i 其 他 操作 数 的 值 时 ， 包 括 这 个 函 
那么 ， 如 采 在 表达 式 的 运算 过 程 中 先 获 取 a 的 值 10， 则 ” 数 调 用 的 表达 式 才 是 合法 的 。 然 
表达 式 的 值 为 15。 但 如 果 是 先 计算 第 二 个 操作 数 ， 那 么 第 而 不 幸 的 是 ， 编 译 器 并 不 容易 精 


一 个 操作 数 的 值 是 20， 而 表达 式 的 值 则 是 25。 确 地 确定 一 个 函数 对 于 函数 以 外 
下 面 的 C 程 序 演示 了 当 函 数 改变 表达 式 中 的 全 局 变量 时 的 变量 所 具有 的 影响 ， 万 其 是 当 

所 产生 的 副作用 问题 : 存在 由 Common 提 供 的 全 局 变量 ， 
int a = 5; 以 及 由 Equivalence 提 供 的 别名 
int funl() 1 :使 用 时 。 这 种 情形 正好 说 明 : 语 

a = 17; 言 定 义 仅仅 说 明了 某 种 结构 的 合 

法 条 件 ， 然 而 这 种 结构 在 程序 中 


} A of funl */ 
void main( ) { 的 合法 性 完全 由 程序 人 员 来 保障 。 
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a =a + funl(); 

} /* of main */ 

a 在 fun2 中 的 计算 值 取决 于 表达 式 a + funl() 中 操作 数 的 求 值 顺序 。a 的 值 将 是 8 (AR 
先 求 值 a) 或 者 20 (如 先 求 值 函数 调用 )。 

注意 ， 数 学 中 的 国 数 没有 副作用 ， 因 为 数学 没有 变量 的 概念 。 它 对 于 纯 国 数 式 程序 设计 语 
言 同样 是 正确 的 。 在 数学 运算 和 纯 函 数 式 程序 设计 语言 中 的 函数 比 命令 式 语言 的 函数 更 容易 推 
理 和 理解 ， 因 为 它们 的 内 容 与 它们 的 含义 是 不 相关 的 。 

对 于 操作 数 求 值 顺序 的 问题 ， 有 两 种 解决 办 法 。 第 一 种 办 法 是 语言 的 设计 人 员 可 以 通过 禁 
止 函 数 的 副作用 从 而 限制 函数 计算 影响 表达 式 的 值 。 避 免 这 个 问题 的 第 二 种 办 法 是 ， 在 语言 角 
定义 中 说 明 将 以 某 种 特定 顺序 对 表达 式 中 的 操作 数 求 值 ， 并 要 求实 现 人 员 能 够 保证 这 种 顺序 。 

完全 禁止 函数 副作用 是 十 分 困难 的 ， 况 且 全 面 地 禁止 将 会 取消 程序 人 员 的 某 些 灵活 性 。 考 
虑 C 和 C++ 中 的 情形 ， 这 两 种 语言 都 是 仅 具 有 函数 的 语言 ， 这 就 意味 着 子 程序 将 返回 一 个 值 。 为 
了 限制 双 四 参数 的 副作用 ， 但 却 仍 然 能 够 提供 返回 多 个 数值 的 子 程序 ， 就 需要 一 种 与 其 他 命令 
式 语 言 中 的 过 程 类 似 的 新 型 子 程序 类 型 。 还 必须 禁止 从 函数 中 访问 全 局 变量 。 然 而 ， 当 效率 十 
分 关键 时 ， 人 允许 对 全 局 变量 的 访问 来 避免 参数 传递 是 提高 执行 速度 的 一 种 重要 方法 。 例 如 ， 在 
编译 名 中 ， 对 符号 表 这 种 数据 的 全 局 访问 是 极为 普通 的 。 

具有 严格 的 求 值 顺序 所 产生 的 问题 是 ， 编 译 器 使 用 的 一 些 代码 优化 技术 将 会 对 操作 数 求 值 
进行 重新 排序 。 当 涉及 函数 调用 时 ， 受 到 保证 的 顺序 就 不 能 允许 这 些 优化 。 因 此 ， 正 如 在 实际 
语言 设计 中 证 实 的 那样 ， 没 有 一 种 十 全 十 美的 解决 办 法 。 

Java 语 言 的 定义 保证 大 致 将 操作 数 以 从 左 到 右 的 顺序 求 值 ， 从 而 避免 了 本 节 所 讨论 的 问题 。 

7.2.2.2 引用 透明 和 副作用 

引用 透明 的 概念 与 函数 副作用 相关 联 并 受 其 影响 。 如 果 程 序 中 某 两 个 有 相同 值 的 表达 式 能 
在 该 程序 的 任何 地 方 彼此 替换 ， 而 不 影响 程序 的 动作 ， 那 么 该 程序 就 具有 引用 透明 性 。 引 用 透 
明 函 数 的 值 全 部 取决 于 它 的 参数 。 “下面 的 例子 说 明了 引用 透明 和 函数 副作用 的 结合 : 

resultl = (fun(a) + b) / (fun(a) - c); 

temp = fun(a); 

result2 = (temp + b) / (temp - c) 

如 采 国 数 fun 没 有 副作用 ，result1 和 result2 就 是 相等 的 ， 因 为 赋值 给 它们 的 表达 式 是 
等 价 的 。 然 而 ， 假 如 fun 有 让 b 或 c 加 1 的 副作用 ，result1 将 不 等 于 result2， 因 此 ， 副 作用 
违反 了 程序 的 引用 透明 。 

引用 透明 程序 有 一 些 优点 。 最 重要 的 优点 是 引用 透明 的 程序 的 语义 比 非 引用 透明 的 程序 的 
语义 更 容易 理解 。 成 为 引用 透明 使 函数 以 更 易于 理解 的 方式 等 价 于 数学 函数 。 

因为 用 纯 函 数 式 语言 编写 的 程序 没有 变量 ， 所 以 它们 都 是 引用 透明 的 。 纯 函数 式 语言 的 函 
数 不 能 有 存储 于 局 部 变量 中 的 状态 。 如 果 这 样 一 个 函数 使 用 一 个 从 函数 外 传 来 的 值 ， 那 么 该 值 
必须 是 前 量 ， 因 为 没有 变量 。 这 样 ， 函 数值 依赖 于 它 的 参数 值 和 可 能 的 一 个 或 多 个 全 局 常量 。 

第 15 章 将 深入 讨论 引用 透明 。 


7.3 重 载 操作 符 
我 们 常常 将 算术 操作 符 用 于 多 种 目的 。 例 如 ， 在 命令 式 程序 设计 语言 中 , “+” 常 用 于 任意 


加 而且， 函数 值 不 能 依赖 于 求 值 参数 时 的 顺序 。 


数值 类 型 的 操作 数 的 加 法 。 某 些 语言 ， 如 Java， 也 使 用 它 进 行 串 的 连接 。 一 个 操作 符 的 多 种 用 
途 被 称 为 操作 符 重 载 。 人 们 通常 认为 可 以 接受 操作 符 的 重 载 ， 只 要 它 没 有 影响 语言 的 可 读 性 及 
可 靠 性 。 

要 说 明 这 种 重 载 可 能 具有 的 危险 性 ， 我 们 考虑 在 C 语 言 中 人 符号 的 使 用 。 当 被 用 作 二 元 操作 
符 时 ， 它 说 明 按 位 的 逻辑 与 (AND) 操作 ， 然 而 当 被 用 作 一 元 操作 符 时 ， 它 的 意义 则 完全 不 同 。 
当 被 用 作 一 个 以 变量 为 操作 数 的 一 元 操作 符 时 ， 它 的 表达 式 的 值 即 是 这 个 变量 的 地 址 。 在 这 种 
情况 下 & 符 号 称 为 地 址 操作 符 。 例 如 ， 执 行 下 面 的 表达 式 

x= & yi 

束 于 致 将 y 的 地 址 放置 于 x 之 中 。& 符 号 的 多 种 用 法 具有 两 个 问题 ,第 一 ， 使 用 同一 个 符号 
进行 两 种 完全 不 相关 的 操作 有 损 于 可 读 性 ， 第 二 ， 因 为 输入 错误 而 漏 掉 了 按 位 逻辑 与 操作 中 的 
第 一 个 操作 数 ， 而 编译 器 不 会 检测 出 来 ， 因 为 它 将 & 符 号 解释 成 为 地 址 操作 符 。 这 种 错误 可 能 
很 难 被 诊断 出 来 。 

基本 上 ， 所 有 的 程序 设计 语言 都 具有 虽然 不 那么 严重 但 却 十 分 类 似 的 问题 , 这 个 问题 通常 来 
源 于 减法 操作 符 的 重 载 。 编 译 器 此 时 将 分 不 清 这 个 操作 符 究竟 应 该 是 一 元 还 是 二 元 的 。 所 以 同 


一 元 与 二 元 ， 这 两 种 操作 的 意义 至 少 还 是 紧密 相关 的 , 因而 还 不 至 于 严重 地 影响 可 读 性 。 

使 用 不 同 的 操作 符 符号 ， 不 但 可 以 增加 可 读 性 , 时 常 还 会 便于 一 般 的 操作 。 除 法 操作 符 就 是 
这 样 的 一 个 例子 。 考 虑 计算 一 组 整数 的 浮 点 平均 数值 的 问题 。 通 常 ， 整 数 之 和 被 计算 为 整数 ， 
假设 将 求 和 的 结果 存 和 人 变量 sum， 并 将 值 的 个 数 丰 人 count 中 。 现 在 ， 如 果 将 要 计算 这 个 浮 点 
平均 数值 ， 并 将 它 放 到 浮 点 变量 avg 之 中 ， 在 C++ 中 可 以 将 这 种 计算 说 明 为 


avg = sum / count; 


但 是 这 项 赋值 在 大 多 数 情况 下 会 产生 一 个 错误 结果 。 因 为 这 个 除法 操作 符 的 两 个 操作 数 都 
是 整数 类 型 ， 整 数 除 法 的 求 值 结果 被 舍 位 为 整数 。 那 么 ， 尽 管 它 的 最 终结 果 (avg) 为 浮 点 类 
型 ， 但 从 这 个 赋值 语句 得 到 的 数值 却 不 能 够 具有 小 数 部 分 。 除 法 的 整数 结果 在 整数 除法 的 含 位 
之 后 才 被 转换 为 浮 点 数 。 

解决 这 个 问题 的 一 种 方法 是 包括 两 个 不 同 的 除法 操作 符 ， 一 个 操作 符 用 于 整数 除法 ， 另 一 
个 操作 符 则 用 于 浮 点 数 除法 。Pascal 就 是 使 用 这 种 解决 办 法 ， 语 言 中 的 div 说 明 整 数 除法 ， 而 / 
件 写 则 说 明 浮 点 除法 。 因 而 可 以 使 用 下 面 的 赋值 来 获得 两 个 整数 sum 和 count 相 除 的 正确 浮 点 
数 商 : 


avg := sum / count 


在 这 里 ，avg 为 浮 点 类 型 。 这 里 的 两 个 操作 数 都 会 被 隐 式 地 转换 为 浮 点 数 ， 从 而 进行 浮 点 
数 的 除法 操作 。 这 类 隐 式 的 转换 操作 将 在 后 面 的 第 7.4.1 节 中 进行 讨论 。 

JavaScript 中 没有 整数 算术 运算 ， 因 而 避免 了 这 种 问题 。 

PHP 则 使 用 为 一 种 解决 办 法 。 在 PHP 中 ， 如 果 两 个 整数 相 除 的 商 不 为 整数 的 话 ， 产 生 的 结 
果 就 是 一 个 浮 点 数 。 

除了 JavaScript 以 及 PHP 之 外 ， 其 他 语言 就 必须 对 整数 操作 数 进行 显 式 的 类 型 转换 。 这 种 转 
换 将 在 第 7.4.2 节 中 讨论 。 

一 些 支 持 抽象 数据 类 型 ( 见 第 11 章 ) 的 语言 ， 例 如 Ada、C++、Fortran 95 以 及 C#， 人 允许 程 
序 人 员 进 一 步 将 操作 符 重 载 。 例 如 ， 假 设 一 个 用 户 想 要 将 * 定义 在 一 个 标量 整数 与 一 个 整数 数 
组 之 间 ， 令 其 意义 为 ， 数 组 的 每 一 个 元 素 都 与 这 个 标量 整数 相 乘 。 这 可 以 通过 编写 一 个 完成 这 
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种 新 的 操作 名 为 * 的 函数 子 程序 来 定义 操作 符 。 当 使 用 一 个 重 载 操作 符 时 , 编译 器 将 会 基于 操 
作 数 的 类 型 来 选择 正确 的 意义 ， 就 像 使 用 语言 定义 的 重 载 操作 符 一 样 。 例 如 ， 如 果 这 种 * 的 新 
定义 是 被 定义 在 一 个 C# 程 序 中 ， 每 当 这 种 * 操作 符 的 出 现 是 以 一 个 简单 整数 作为 其 左 操作 数 ， 
并 以 一 个 整数 数组 作为 其 右 操 作 数 时 ，C# 的 编译 器 就 会 对 * 符号 使 用 新 的 定义 。 

如 果 谨 慎 地 使 用 用 户 定义 的 操作 符 重 载 ， 会 有 助 于 提高 可 读 性 。 例 如 ， 如 果 + 和 * 操作 符 
对 矩阵 抽象 数据 类 型 重 载 ， 并 且 A，B，C 和 D 为 这 种 类 型 的 变量 , 那么 就 可 以 使 用 

A* B+ CC *D 
来 代替 

MatrixAdd ( MatrixMult (A,B), MatrixMult(C,D) ) 

但 在 另 一 方面 ， 用户 定义 的 操作 符 重 载 则 可 能 有 损 可 读 性 。 可 以 肯定 的 是 ， 没 有 什么 能 阻 
止 用 户 将 “+” 定 义 为 乘法 。 此 外 ， 当 读者 在 程序 中 看 见 一 个 * 操作 符 ， 首 先 必须 找 出 两 个 操 
作 数 的 类 型 ， 以 及 操作 符 本 身 的 定义 ， 以 便 确 定 它 的 实际 意义 。 任 何 或 者 所 有 的 相关 定义 都 可 
能 是 在 其 他 文件 中 。 

C++ 具有 少数 不 能 被 重 载 的 操作 符 ， 这 些 操作 符 是 类 或 结构 成 员 操作 符 〈.)， 以 及 作用 域 操 
作 符 〈::) 。 有 趣 的 是 ， 操 作 符 重 载 是 没有 被 复制 到 Java 中 的 C++ 语言 特性 之 中 ， 然 而 却 出 现在 
EZP 

关于 用 户 定义 的 操作 符 重 载 ， 将 在 第 9 章 中 进行 讨论 。 


7.4 类 型 转换 | 
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”种 类 型 并 非 可 以 存储 所 有 原 有 类 型 的 值 ， 哪 怕 是 近似 的 值 。 例 如 ， 在 Java 中 将 一 个 double 的 值 


转换 成 一 个 ELoat 的 值 (double 的 范围 比 El1o0at 的 范围 大 很 多 ) 。 宽 化 转换 也 是 将 值 转换 成 另 
一 种 类 型 ， 但 是 这 种 类 型 至 少 能 够 包括 所 有 原 有 类 型 的 值 的 近似 值 。 例 如 ， 在 Java 中 将 一 个 
int 的 值 转换 成 一 个 ELoat 的 值 。 宽 化 转换 几乎 总 是 安全 的 转换 的 值 的 大 小 保持 不 变 。 而 穿 化 
转换 则 不 然 一 一 有 时 转换 的 值 的 大 小 会 在 处 理 过 程 中 改变 。 例 如 ， 如 果 将 浮 点 数 1.3E25 转 换 成 
一 个 整数 ， 其 结果 将 与 原 数值 相去 其 远 。 

于 对 基本 数值 类 型 来 说 ， 宽 化 和 穿 化 转换 的 问题 是 相对 简单 的 。 例 如 ， 在 Java 中 ， 下 面 内 
容 是 基本 数值 类 型 的 宽 化 转换 : 

byte to short, int, long, float, or double 

short to int, long, float, or double 

char to int, long, float, or double 

int to long, float or double 


long to float or double 
float to double 


罕 化 转换 是 : 

short to byte or char 

char to byte or short 

int to byte, short, or char 

long to byte, short, char, or int 

float to byte, short, char, int, or long 

double to byte, short, char, int, long, or float 


虽然 宽 化 转换 通 稼 是 安全 的 ， 但 却 有 可 能 降低 准确 度 。 在 许多 语言 的 实现 中 ， 尽 管 整 数 到 
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浮 点 数 的 转换 为 宽 化 转换 ， 但 可 能 会 丢失 某 些 准确 度 。 例 如 ， 在 某 些 实现 中 ， 将 整数 存储 于 32 
位 ， 允 许 至 少 9 位 十 进 制 数字 的 精确 度 。 但 在 许多 情况 下 ， 也 将 浮 点 数值 存储 于 32 位 ， 却 只 具有 
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大 约 7 个 小 数 数字 的 精确 度 (因为 需要 字 位 来 存放 乘客 )。 因 此 ， 整 数 到 浮 点 数 的 宽 化 就 可 能 


致 损失 了 两 位 数字 的 精确 度 。 


当然 ， 非 基本 类 型 的 强制 转换 是 更 复杂 的 。 第 5 章 讨 论 了 数组 和 记录 类 型 的 赋值 兼容 性 的 复 
杂 性 。 这 也 存在 着 方法 的 参数 类 型 和 返回 类 型 允许 全 重 写 超 类 中 的 方法 的 问题 一 一 只 有 当 类 型 


相同 时 ， 或 一 些 其 他 情况 下 。 与 子 类 作为 子 类 型 的 概念 相同 ， 第 12 章 将 讨论 这 个 问题 。 
类 型 的 转换 可 以 是 显 式 的 也 可 以 是 隐 式 的 。 下 面 的 两 个 小 节 将 讨论 这 两 种 类 型 转换 。 


7.4.1 表达 式 中 的 强制 转换 
算术 表达 式 设 计 中 的 决策 之 一 ， 


匀称 为 强制 转换 的 规则 ， 因 为 通常 ， 计 算 机 并 没有 取 不 同 
类 型 操作 数 的 二 元 操作 。 第 5 章 里 我 们 曾经 定义 过 强制 转换 ， 
它 是 一 种 由 编译 器 启动 的 隐 式 类 型 转换 。 我 们 将 由 程序 人 
员 明 确 要 求 的 类 型 转换 称 为 显 式 转换 或 类 型 转换 ， 而 不 是 
强制 转换 。 

虽然 可 以 将 茶 些 操作 符 重 载 ， 但 我 们 假设 一 个 计算 机 系 
统 ， 在 它 的 硬件 或 某 个 层次 的 软件 模拟 中 ， 对 每 一 种 操作 数 
类 型 和 语言 中 所 定义 的 每 一 个 操作 符 都 具有 一 种 相应 的 操 
作 。. 对 于 使 用 静态 类 型 绑 定 的 语言 中 的 一 种 重 载 操 作 符 ， 
编译 器 是 基于 操作 数 的 类 型 来 选择 正确 的 操作 类 型 。 当 操作 
符 的 两 个 操作 数 属于 不 同 的 类 型 ， 但 是 这 种 情况 在 这 种 语言 
中 为 合法 时 ， 编 译 器 必须 选择 其 中 的 一 个 操作 数 进行 强制 转 
换 ， 并 为 这 种 强制 转换 提供 代码 。 在 下 面 的 讨论 中 ， 我 们 研 
究 在 一 些 常见 语言 中 有 关 强 制 转换 的 设计 选择 。 

语言 的 设计 人 员 在 算术 表达 式 的 强制 转换 问题 上 没有 
达成 一 致 。 那 些 反 对 广泛 范围 的 强制 转换 的 人 员 ， 担 心 强 
制 转换 会 引起 可 靠 性 问题 ， 因 为 这 类 转换 将 抵消 类 型 检测 
的 优势 ， 而 那些 愿意 包括 所 有 强制 转换 的 人 员 ， 则 更 担心 
严格 的 限制 会 导致 形 失 灵活 性 。 这 里 的 问题 是 ， 程 序 人 员 
征 否 应 该 关注 这 种 类 型 的 错误 ， 或 者 编译 器 是 否 应 该 检测 
这 种 类 型 的 错误 。 


作为 对 这 个 问题 的 一 种 简单 解释 ， 考 虑 下 面 的 Java 代 码 : 


int a; 
float b, c, d; 


d=b* a; 


假设 ， 这 个 乘法 操作 符 的 第 二 个 操作 数 应 该 为 c， 但 是 由 于 键入 错误 ， 它 变 成 了 a。 因 为 在 


是 决定 一 个 操作 符 是 否 能 够 允许 不 同类 型 的 操作 数 。 如 果 
允许 则 被 称 为 混合 模式 表达 式 ， 包 含 这 种 表达 式 的 语言 必须 为 隐 式 的 操作 数 类 型 转换 定义 一 种 


太 多 强制 转换 会 造成 危险 并 
为 此 付出 代价 ， 下 面 给 出 一 个 较 
为 极 痛 的 例子 ,考虑 PL/I 为 了 实 
现 表 达 式 中 的 灵活 性 而 做 出 的 努 
A, 在 PL/I 语 言 中 ， 可 以 将 一 个 
字符 事变 量 与 表达 式 中 的 一 个 整 
数 相 结合 。 在 运行 时 ， 系 统 对 这 
个 字符 串 进 行 扫 描 以 便 找 到 数值 。 
如 果 这 个 数值 恰恰 包含 了 一 个 小 
数 点 ， 将 设 这 个 数值 为 浮 点 数 类 
型 ， 将 另 一 个 操作 数 强 制 转换 为 
浮 点 数 ， 并 且 产 生 最 后 结果 的 操 
作 也 是 浮 点 的 。 这 种 强制 转换 的 
策略 是 高 代价 的 ， 因 为 必须 在 运 
行 时 进行 类 型 检测 和 类 型 转换 。 
这 也 消除 了 在 表达 式 中 发 现 程序 
人 员 错 误 的 可 能 性 ， 因 为 二 元 操 
作 符 可 以 将 一 个 任何 类 型 的 操作 
数 与 另 一 个 任何 类 型 的 操作 数 相 


gi A 
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O 这 种 假设 对 许多 语言 都 是 非 真 的 。 我 们 将 在 本 节 的 后 面 给 出 关于 这 点 的 一 个 例子 。 
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Java 中 ， 混 合 模式 表达 式 是 合法 的 ， 编 译 器 就 不 能 够 检测 出 这 个 错误 。 结 采 ， 编 译 右 只 丰 插 和 人 
代码 来 强制 转换 int 型 操作 数 a 的 值 为 float 。 如 果 在 Java 中 ， 混 合 模式 表达 式 为 不 合法 的 , 编 
译 器 就 能 够 发 现 这 个 键 和 人 错误 引起 的 类 型 错误 。 

由 于 允许 混合 模式 表达 式 会 减少 发 现 错误 的 可 能 性 ， 所 以 Ada 只 允许 表达 式 中 少量 的 混合 
类 型 操作 数 。 它 不 允许 将 表达 式 中 的 整数 与 浮 点 操作 数 相 混合 ， 然 而 还 是 有 一 种 例外 : RER 
作 符 ** 可 以 使 用 一 个 浮 点 数 或 整数 类 型 来 作为 它 的 第 一 个 操作 数 ， 使 用 一 个 整数 类 型 来 作为 它 
的 第 二 个 操作 数 。Ada 也 允许 少数 其 他 种 类 的 操作 数 类 型 相互 混合 ， 通 常 这 些 操 作 数 的 类 型 十 
与 子 范围 类 型 有 关 的 类 型 。 如 果 是 使 用 Ada 语 言 来 编写 上 面 的 Java 代 码 ， 就 成 为 下 面 的 样子 : 


A : Integer; 
B, C; D = Float; 


Ada 编 译 器 将 会 认为 上 面 的 表达 式 是 错误 的 ， 原 因 是 对 于 “*” 操 作 符 而 言 ， Float 操 作 数 
与 TInteger 操 作 数 是 不 能 够 混合 的 。 

但 在 大 多 数 其 他 常见 语言 中 ， 对 混合 模式 算术 表达 式 不 存在 限制 。 

基于 C 的 语言 中 ， 有 比 int 类 型 小 的 整数 类 型 。 在 Java 语 言 中 ， 这 些 类 型 是 byte 和 short。 
实际 上 当 有 任何 操作 符 作 用 于 它们 时 ， 所 有 这 些 类 型 的 操作 数 都 被 强制 转换 为 Int 类型。 所 以 
虽然 可 以 将 数据 存储 于 这 些 类 型 的 变量 中 ， 但 只 有 将 这 些 数据 强制 转换 到 一 个 较 大 类 型 之 后 才 
能 够 处 理 这 些 数据 。 例 如 ， 考 虑 下 面 的 Java 人 代码: 


byte a, b, c; 
a =D + Gi 


b 和 c 的 值 被 强制 转换 为 int， 然 后 才 进 行 int 的 加 法 。 最 后 将 其 和 转换 成 byte 并 放 和 人 a 中 。 
考虑 到 当代 计算 机 的 大 容量 内 存 ， 所 以 很 难 激 起 使 byte 和 short 的 兴趣 ， 除 非 在 存储 大 量 数据 
的 情况 下 。 


7.4.2 显 式 类 型 转换 


大 多 数 的 语言 都 提供 进行 显 式 转换 的 功能 ， 包 括 窗 化 转换 和 宽 化 转换 两 种 类 型 。 在 某 些 情 
况 下 ， 当 显 式 罕 化 转换 导致 了 被 转换 对 象 的 值 发 生 重大 变化 时 ， 则 产生 警告 信息 。 

在 基于 C 的 语言 中 ， 将 显 式 类 型 转换 称 为 类 型 转换 (cast) 。 在 表达 式 被 转换 之 前 ， 将 期 望 
的 类 型 放 入 括号 内 ， 如 下 所 示 : 


(int) angle 


使 用 括号 将 类 型 名 称 包括 起 来 的 原因 之 一 ， 是 因为 第 一 种 允许 这 种 转换 的 语言 C 具 有 几 个 
两 个 字 的 类 型 名 称 ， 如 long int, 
Ada 提 供 具有 函数 调用 语法 的 显 式 转换 操作 。 例 如 ， 


Float (Sum) 


回顾 一 下 (第 5 章 )，Ada 也 有 通用 类 型 转换 函数 Unchecked_Conversion， 它 不 改变 值 
的 表示 一 一 只 改变 其 类 型 。 
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7.4.3 表达 式 中 的 错误 


在 表达 式 运算 中 可 能 会 出 现 一 些 错 误 。 如 果 语 言 要 求 进行 类 型 检测 ， 静 态 或 动态 ， 就 不 会 
产生 操作 数 类 型 的 错误 。 我 们 已 经 讨论 了 由 于 表达 式 中 操作 数 的 强制 转换 所 产生 的 错误 。 另 一 
种 类 型 错误 是 由 于 计算 机 算术 中 的 限制 ， 以 及 算术 本 身 固有 的 限制 。 最 常见 的 一 个 错误 是 不 能 
金 将 操作 结果 表示 在 必须 用 来 存储 它 的 存储 单位 中 。 取 决 于 操作 结果 的 大 小 ， 结 果 太 大 被 称 为 
上 省 《overflow)， 结 果 太 小 则 被 称 为 下 溢 (underflow)。 至 于 在 算术 上 的 一 种 限制 ， 是 不 允许 
对 零 实 施 除 法 。 当 然 ， 在 数学 上 遭 到 禁止 的 事实 ， 并 不 妨碍 程序 企图 实施 . 

泽 扩 数 的 上 溢 与 下 溢 以 及 零 除法 是 运行 时 错误 的 例子 ， 有 了 时 也 称 为 异常 。 关 于 允许 程序 发 
现 并 处 理 异常 的 语言 机 制 ， 将 在 第 14 章 中 进行 讨论 。 


7.5 关系 表达 式 和 布尔 表达 式 
除了 算术 表达 式 之 外 ， 程 序 设计 语言 还 具有 关系 表达 式 和 布尔 表达 式 。 
7.5.1 关系 表达 式 


关系 操作 符 是 将 两 个 操作 数 的 值 相 比较 的 操作 符 。 关 系 表达 式 具有 两 个 操作 数 及 个 关系 
操作 符 。 关 系 表达 式 的 值 是 布尔 值 ， 除 非 语言 中 不 具有 布尔 类 型 。 关 系 操作 符 也 常常 为 多 种 类 
IDI MMM oe 
于 操作 数 的 类 型 。 它 可 能 相当 简单 ， 就 像 整数 操作 数 的 情 -一 一 
形 ， 也 可 能 十 分 复杂 ， 就 像 字符 串 操作 数 的 情形 ， 哄 型 情 pe 
况 下 ， 可 以 用 于 关系 操作 符 的 操作 数 关 型 只 有 数值 关 型 、 RAAE 
字符 串 类 型 以 及 序数 类 型 ， : 

在 一 些 常用 语言 中 ， 现 有 的 关系 操作 符 的 语法 如 下 ， 


操作 Ada 基于 C 的 语言 Fortran 95 
相等 = == .EQ. == 
不 等 |= | = .NE. 或 <> 
天 于 > > -GT. W, > 
小 于 < < LT.  < 
大 于 等 于 5a ii .GE。 或 >= 
小 于 等 于 <= — -LE. 或 >= 

_————- je 


Javascript 和 PHP 语 言 还 具有 另外 两 个 关系 操作 符 ，=== 和 ==. 这 两 个 操作 符 分 别 与 == 
和 != 操作 符 相 类 似 ， 但 是 却 不 允许 进行 操作 数 类 型 的 强制 转换 。 例 如 ， 下 面 的 表达 式 
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在 JavaScript 里 为 真 ， 因 为 当 关 系 操作 符 的 操作 数 是 字符 串 及 数值 时 ， 字 符 串 则 被 强制 转换 
成 为 数值 。 然 而 

“7 "=== 7 
却 为 假 ， 原 因 是 这 个 操作 符 不 允许 实施 操作 数 的 强制 转换 ， 

Ruby 使 用 == 作 为 使 用 强制 转换 的 等 于 关系 操作 符 ， 使 用 eq1l? 作 为 不 带 强制 转换 的 等 于 
(这 需要 操作 数 的 类 型 和 值 是 相等 的 )。 Ruby 只 在 case 语 句 的 when 从 句 中 使 用 ===， 这 将 在 第 8 
章 里 讨论 。 
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关系 操作 符 总 是 比 算术 操作 符 具 有 较 低 的 优先 级 ， 所 以 在 下 面 的 表达 式 中 : 


à&a t 1> 2% p 
就 是 先 计 算 其 中 的 算术 表达 式 。 
7.5.2 布尔 表达 式 


布尔 表达 式 由 布尔 变量 、 布 尔 常 量 、 关 系 表达 式 以 及 布尔 操作 符 构 成 。 这 些 操作 符 通常 包 
括 了 用 来 进行 与 (AND)、 或 (OR) 和 非 (NOT) 操作 的 操作 符 ， 有 时 还 包括 了 异 或 
(exclusive OR) 和 等 价 操作 符 。 布 尔 操 作 符 通常 只 取 布 尔 类 型 的 操作 数 (布尔 变量 、 布 尔 字面 
第 量 或 者 关系 表达 式 )， 而 产生 的 是 布尔 值 。 

在 布尔 代数 中 ，OR 和 AND 操 作 符 有 着 相同 的 优先 级 。 为 了 与 此 相 一 致 ，Ada 的 OR 和 AND 
操作 符 也 具有 相同 的 优先 级 。 然 而 在 基于 C 的 语言 中 ，AND 操 作 符 的 优先 级 则 高 于 OR。 也 许 ， 
这 是 将 AND 与 乘法 ，OR 与 加 法 毫 无 根基 地 关联 起 来 的 结果 。 而 这 种 关联 自然 导致 了 AND 的 优 
先 级 高 于 OR。 

因为 算术 表达 式 可 以 成 为 关系 表达 式 的 操作 数 ， 又 因为 关系 表达 式 可 以 成 为 布尔 表达 式 的 
操作 数 ， 因 而 必须 将 这 三 类 操作 符 放置 于 它们 彼此 相对 的 优先 级 层次 中 。 

在 基于 C 的 语言 中 ， 算术、 关系 和 布尔 操作 符 的 优先 级 为 : 


最 高 级 别 后 级 ++, -- 
一 00 -, AUR ++, --, ! 
e, E 
ie F, = 
<, >, <=, >= 
=, | = 
&& 
最 低级 别 | | 


59?9 之 前 的 C 语 言 版 本 在 流行 的 命令 式 语言 中 是 一 个 例外 ， 这 些 版 本 中 不 具有 布尔 类 型 ， 因 
此 也 不 具有 布尔 值 。 代 之 ， 它 们 使 用 数值 来 代表 布尔 值 。 在 需要 布尔 操作 数 的 位 置 上 放置 数值 
变量 及 和 贡 量 ， 并 将 零 值 认为 是 假 ， 而 将 所 有 非 零 值 认为 是 真 。 这 种 表达 式 的 计算 结果 是 整数 ， 
如 朱 为 假 ， 具 有 值 0， 如 果 为 真 ， 则 具有 值 1。 如 果 这 样 一 个 表达 式 只 有 一 个 关系 操作 符 ， 没 有 
布尔 操作 数 ， 那 么 它 的 形式 是 常见 的 。 例 如 

> A Wl 

含有 布尔 操作 符 的 表达 式 有 不 常见 的 表现 形式 ， 如 下 : 

ptr && count 

其 中 ，ptr 是 指针 ， 而 count 是 int 型 的 变量 。 该 表达 式 的 求 值 结果 是 一 个 整数 ， 当 为 假 时 
值 为 0， 当 为 真 时 值 为 1。 在 C99 以 及 C++ 中 ， 也 可 以 使 用 算术 表达 式 来 作为 布尔 表达 式 。 

这 种 C 语 言 设计 的 一 个 奇怪 结果 是 使 得 表达 式 

a > D > e 

成 为 合法 的 。 因 为 C 的 关系 操作 符 为 左 结合 的 ， 所 以 先 计算 最 左边 的 关系 操作 符 ， 它 产生 0 
或 1。 然 后 接着 将 这 个 结果 与 变量 c 相 比较 。 这 里 就 不 再 存在 b 与 c 之 间 的 比较 ， 

一 些 语言 ， 包 括 Perl 和 Ruby， 提 供 了 两 套 二 元 逻辑 操作 符 ， 为 AND 提 供 了 gg 和 and， 以 及 
为 OR 提供 了 or 和 ||。 一 个 在 sg 和 and (|| 和 or) 之 间 的 不 同 之 处 是 拼写 版 具有 更 低 的 优先 级 ， 
而 且 ，and 和 or 具有 相同 的 优先 级 ,但 是 g& 有 比 | | 更 高 的 优先 级 。 
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在 基于 C 的 语言 中 ， 连 同 非 算术 操作 符 在 内 ， 总 共有 超过 40 个 操作 符 ， 以 及 至 少 具 有 14 个 
不 同 层次 的 优先 级 别 。 这 显然 正好 证 明了 这 些 语言 中 操作 符 集 之 丰富 ， 以 及 它们 的 表达 式 可 能 
具有 的 相当 程度 的 复杂 性 。 

正如 我 们 曾经 在 第 6 章 里 陈述 过 的 ， 可 读 性 要 求 语言 应 该 包括 布尔 类 型 ， 而 不 是 在 布尔 表达 
式 中 使 用 数值 类 型 。 这 种 数值 类 型 的 代替 使 用 可 能 会 丢失 了 应 被 发 现 的 错误 。 因 为 任何 数值 表 
达 式 ， 不 论 是 有 意 还 是 无 意 ， 都 是 布尔 操作 符 的 一 个 合法 操作 数 。 在 其 他 的 命令 式 语言 中 ， 使 
用 任何 非 布尔 表达 式 来 作为 布尔 操作 符 的 操作 数 ， 都 被 检测 为 错误 。 


7.6 短路 求 值 


表达 式 的 短路 求 值 是 指 在 没有 计算 完 表 达 式 中 所 有 的 操作 数 或 操作 符 之 前 ， 确 定 表 达 式 的 
结果 。 例 如 ， 下 面 算术 表达 式 的 值 

(1S a aya fo f AX = Tj 

如 来 a 为 0 的 话 ， 就 将 与 (b / 13 - 1) 的 值 不 相关 ， 因 为 对 于 任意 的 x, 0 * x = 0, 
所 以 当 a 为 0 时 ， 就 没有 必要 计算 (b / 13 - 1), 或 者 进行 第 二 项 的 乘法 。 然 而 在 运行 期 间 ， 
却 并 不 容易 发 现 这 种 算术 表达 式 中 的 捷径 ， 因 而 从 来 也 没有 被 采用 。 

布尔 表达 式 的 值 


(a >= 0) && (b < 10) 


MR ( a < 0 ) ， 整 个 表达 式 的 值 与 第 二 个 关系 表达 式 无 关 ， 因 为 对 于 x 的 任意 值 ， 表 达 
J (FALSE && (b<10)) 都 为 FALSE。 所 以 当 a < 0 时 ， 就 没有 必要 对 b、 常 量 10、 第 二 个 关 
系 表 达 式 或 者 && 操 作 进行 求 值 。 不 像 算术 表达 式 的 情形 ， 在 执行 期 间 很 容易 发 现 这 种 捷径 。 

为 了 解释 布尔 表达 式 非 短路 求 值 中 的 一 个 潜在 问题 ， 假 设 Java 不 使 用 短路 求 值 。 现 在 ， 再 
假设 我 们 使 用 while 语 句 来 编写 查询 表 的 循环 。 下 面 是 用 于 这 种 查询 的 一 段 简单 的 Java 代 码 ， 
假定 1ist 具 有 1listlen 个 元 素 ， 它 是 将 要 被 搜寻 的 数组 ， 而 key 是 所 搜寻 的 值 ， 

index = 0; 

while ((index < listlen) && (list[index]! = key) ) 

index = index + 1; 

如 有 果 这 种 求 值 不 是 短路 的 ， 则 无 论 第 一 个 关系 表达 式 的 值 是 什么 ， 都 需要 计算 while 语 句 
中 布尔 表达 式 中 的 两 个 关系 表达 式 。 因 此 如 果 key 不 在 1ist 中 ， 程 序 将 会 终止 于 下 标 出 界 的 错 
误 。 具有 index == 1istlen 的 循环 执行 会 导致 对 list [1istlen] 的 引用 ， 从 而 引起 检索 
错误 ， 因 为 1ist 被 声明 为 以 Listlen - 1 为 下 标 值 的 上 界 。 

如 采 一 种 语言 提供 布尔 表达 式 的 短路 求 值 并 被 使 用 ， 这 将 不 会 成 为 一 个 问题 。 在 前 面 的 例 
子 中 ， 短 路 求 值 方案 将 会 计算 AND 操 作 符 的 第 一 个 操作 数 ， 如 果 第 一 个 操作 数 为 假 ， 则 会 越过 
它 的 第 二 个 操作 数 。 

一 种 提供 布尔 表达 式 的 短路 求 值 和 在 表达 式 中 有 副作用 的 语言 允许 精巧 错误 发 生 。 假 设 将 
短路 求 值 运用 于 一 个 表达 式 ， 并 且 ， 这 个 表达 式 中 包含 副作用 的 部 分 没有 被 计算 ， 那 么 副作用 
就 会 出 现在 当 整 个 表达 式 的 计算 完成 之 时 。 如 果 这 个 副作用 决定 了 程序 的 正确 性 ， 短 路 求 值 就 
可 能 造成 一 种 严重 的 错误 。 例 如 ， 考 虑 C 的 表达 式 

(a > by || (++) 7 3) 


在 这 个 表达 式 中 ， 只 有 a <= b 时 才 会 改变 b 值 (在 第 二 个 算术 表达 式 中 )。 如 果 程 序 人 员 
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假设 执行 期 间 每 一 次 计算 表达 式 时 ， 都 会 改变 b (并 且 程 序 的 正确 性 取决 于 这 种 改变 )， 那 么 这 
个 程序 注定 将 失败 。 

Ada 通 过 使 用 两 个 字 的 操作 符 and then 以 及 or else， 来 允许 编程 人 员 说 明 布尔 操作 符 
AND 和 OR 的 短路 求 值 。 例 如 ， 我 们 再 次 假设 List 被 声明 为 具有 下 标 范围 1. .Listlen, 这 样 ， 
Ada 的 代码 为 

Index := 1; 

while (Index <= Listlen) and then (List (Index) /= Key) 

loop 


Index := Index + 1; 
end loop; 


bth nm pt nr mm re AE 


err 按 位 操作 符 AND 和 OR， 分 别 标记 为 8 和 |， 可 以 将 它们 用 于 布 尔 数 值 的 操作 数 
但 却 不 是 短路 的 。 当 然 ， 如 果 所 有 的 操作 数 都 被 限制 为 1 (为 真 ) 或 者 为 0 (为 假 ) 时 ， 这 些 按 
位 操作 符 将 与 通常 的 布尔 操作 符 等 价 。 

Ruby、Per 和 Python 的 所 有 逻辑 操作 符 都 是 短路 求 值 的 。 

在 Ada 语 言 中 ， 包 括 短路 操作 符 和 一 般 操 作 符 ， 显 然 是 最 佳 的 设计 方案 ， 因 为 它 给 程序 
员 提供 了 对 任何 一 种 或 所 有 的 布尔 表达 式 选 择 短路 求 值 的 灵活 性 。 


7.7 赋值 语句 


正如 前 面 所 说 ， 赋 值 语句 是 命令 式 语 言 的 核心 结构 之 一 。 它 为 用 户 可 以 动态 地 改变 值 到 变 
量 的 绑 定 提供 了 一 种 机 制 。 在 下 面 的 这 一 节 里 ， 我 们 将 讨论 赋值 语句 的 最 简单 形式 ， 而 在 余 后 
的 几 节 中 ， 将 描述 多 种 替代 方案 。 


7.7.1 简单 赋值 


简单 赋值 语句 的 一 般 语 法 为 

< 目标 _ 变 量 > < 赋值 _ 操 作 符 > < 表达 式 > 

儿 乎 目前 所 有 的 程序 设计 语言 都 使 用 等 号 作为 赋值 操作 符 。 它 们 用 不 同 于 等 号 的 符号 作为 
等 于 关系 操作 符 ， 以 避免 与 它们 的 赋值 操作 符 相 混淆 。 

ALGOL 60 开 创 了 使 用 := 作为 赋值 操作 符 的 先例 ，Ada 语 言 也 沿用 了 这 种 选择 。 

在 基于 C 的 语言 中 ， 将 赋值 操作 符 作为 二 元 操作 符 来 处 理 ， 并 因此 能 够 将 它 嵌 入 到 表达 式 
中 。 我 们 将 在 第 7.7.5 节 讨论 这 种 操作 符 。 

在 一 种 语言 中 怎样 使 用 赋值 ， 有 关 的 设计 选择 十 分 不 同 。 在 一 些 语言 中 ， 如 Fortran 和 Ada， 
从 能 将 赋值 作为 单独 语 名 出现， 并 且 将 它 的 目标 变量 限制 为 单个 变量 。 然 而 还 有 许多 不 同 的 
方案 。 


7.7.2 条 件 目标 
C++ 允 许 赋值 语句 的 条 件 目 标 。 例 如 ， 


flag ? countl : count2 = 0; 


它 等 价 于 


if (flag) 
countl = 0; 
else 
count2 = 0; 


7.7.3 复合 赋值 操作 符 


复合 赋值 操作 符 是 一 种 说 明 普 遍 需 要 的 赋值 形式 的 向 写 方 法 。 运 用 这 项 技术 可 以 缩写 赋值 
形式 ， 目 标 变量 也 可 以 作为 第 一 个 操作 数 出 现在 右边 的 表达 式 中 ， 例 如 ， 

a=at+tb 

由 ALGOL 68 引 入 的 复合 赋值 操作 符 后 来 被 C 采 纳 ， 但 形式 稍 有 不 同 ， 这 种 形式 也 成 为 其 
他 基于 C 的 语言 以 及 Perl、JavaScript、Python 和 Ruby 中 的 部 分 。 这 些 赋值 操作 符 的 语法 是 所 要 
求 的 二 元 操作 符 与 = 操作 符 的 连接 。 例 如 ， 

sum += value; 

Cory 

sum = sum + value; 


基于 C 的 语言 中 的 大 多 数 二 元 操作 符 都 有 复合 赋值 操作 符 的 版 本 。 
7.7.4 一 元 赋值 操作 符 


基于 C 的 语言 包括 了 两 种 特殊 的 一 元 算术 操作 符 ， 实 际 上 它们 是 缩写 的 赋值 语句 。 这 类 操作 
符 将 递增 和 递减 操作 与 赋值 相 结 合 。++ 操 作 符 为 递增 ，-- 操作 符 为 递减 , 可 以 将 它们 用 于 表达 式 
中 ， 或 者 形成 单个 操作 符 的 赋值 语句 。 它 们 可 以 作为 前 绥 操 作 符 出 现 , 这 意味 着 将 它们 放置 于 操 
作 数 的 前 面 ， 也 可 以 作为 后 缀 操作 符 出 现 ， 这 意味 着 将 它们 紧 跟 在 操作 数 的 后 面 。 赋 值 语句 


sum = ++ count; 
将 count 的 值 增加 1， 然 后 赋 给 sum。 也 可 以 将 它 表 示 为 


count = count + 1; 
sum = count; 


如 采 将 这 个 操作 符 作 为 后 缀 操作 符 ， 如 下 


sum = count ++; 


则 首先 将 count 的 值 赋 给 sum;， 然后 才 将 count 递 增 ，。 历史 注释 


其 效果 与 下 面 这 两 条 语句 相同 ee te 
型 计算 机 具有 自动 递增 和 自动 递 
sum = count; 
count = count + 1; 减 的 寻 址 模式 ， 它 们 是 将 C 的 递 
rah = c : 增 和 递减 操作 符 用 作 数 组 下 标 时 
使 用 一 元 递增 操作 符 形 成 一 条 完整 赋值 语句 的 一 个 例 


的 硬件 版 本 。 在 这 里 ， 我 们 也 许 


FA 会 猜测 ， 这 些 C 操 作 符 的 设计 是 
count ++; 基于 PDP-11 型 机 器 的 体系 结构 
它 仅仅 是 count 的 递增 。 看 起 来 这 似乎 不 像 是 赋值 ，。 的 。 然而 ， 这 种 猜测 是 错误 的 ， 


但 它 确实 是 赋值 ， 并 签 价 于 语句 因为 这 些 C 的 操作 符 继 承 自 B 话 
言 ， 而 也 语言 的 设计 在 第 一 台 


count = count + 1; 
PDP-11 出 现 之 前 就 已 经 完成 。 
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当 将 两 个 一 元 操作 符 运用 于 同一 个 操作 数 时 ， 其 结合 性 是 从 右 到 左 的 。 例 如 ， 
= count ++ 
首先 将 count 递 增 ， 然 后 才 改变 它 的 正 负 号 。 因 此 它 是 


一 (count ++) 


而 不 是 


(= count) ++ 


7.7.5 赋值 作为 表达 式 


在 基于 C 的 语言 Per 和 JavaScript 中 ， 赋 值 语句 生成 一 个 与 赋 给 目标 的 值 相同 的 结果 。 因 此 
可 以 将 它 用 作 表 达 式 ,或 者 将 它 用 作 其 他 表达 式 中 的 操作 数 。 在 这 种 设计 中 ， 对 待 赋值 操作 符 
就 像 对 待 其 他 任何 二 元 操作 符 一 样 ， 只 是 这 个 操作 符 具有 改变 左 操作 数 的 副作用 。 例 如 ， 在 C 中 
经 党 将 语句 写 为 


while ((ch = getchar()) != EOF) { ... } 


在 这 条 语句 中 ， 来 自 标准 输入 文件 (通常 为 键盘 ) 中 的 下 一 个 字符 通过 getchar 获 得 ， 并 
将 它 赋 给 变量 ch。 其 结果 (或 者 是 被 赋 的 值 ) 然后 与 常量 BOF 进 行 比较 。 如 果 ch 不 等 于 EOF 
就 执行 复合 语句 {. . .}。 注 意 ， 我 们 必须 将 赋值 语句 括 起 来 ， 在 支持 赋值 作为 表达 式 的 语言 
因为 在 这 些 语言 中 赋值 操作 符 的 优先 级 低 于 关系 操作 符 的 优先 级 。 如 果 没 有 括号 ， 新 的 字符 会 
自 先 与 EOF 进 行 比较 ， 然 后 再 将 这 种 比较 结果 ，0 或 者 1， 赋 给 ch， 

允许 赋值 语句 成 为 表达 式 中 的 操作 数 ， 这 个 特性 所 具有 的 缺点 是 导致 了 另 一 类 表达 式 副 作 
用 。 这 类 副作用 使 得 表达 式 难 读 又 难 理解 。 一 个 具有 任何 种 类 的 副作用 的 表达 式 都 有 这 种 缺点 。 
这 样 的 表达 式 看 起 来 只 是 一 串 具 有 奇怪 执行 顺序 的 指令 ， 很 难 被 解读 ， 但 在 数学 上 它 是 一 种 值 
的 标记 。 例 如 ， 表 达 式 

a=b+(c=d / btt) - 1 

所 标记 的 指令 为 

iitb24 temp 

tb + 1 给 b 

itd / temp 给 c 

tb + c 给 temp 

iittemp - 1 给 a 

请 注意 ， 把 赋值 操作 符 当 作 任 何其 他 二 元 操作 符 的 处 理 允 许多 目标 赋值 的 效果 ， 如 


sum = count = 0; 


这 个 式 子 先 将 count 赋 以 零 值 ， 然 后 再 将 count 的 值 赋 给 sum 

在 C 的 设计 中 ， 赋 值 操作 会 遗漏 错误 检查 ， 这 常常 会 导致 程序 错误 ， 尤其 是 如 果 我 们 键入 
的 是 

if (x ey) vas À 

而 不 是 

if (x == y) ... 


这 是 一 个 相当 容易 产生 的 错误 ， 然 而 却 不 能 够 被 编译 器 检查 出 来 。 编译 句 仅 仅 是 测试 赋 给 


x 的 值 ， 而 不 是 测试 这 个 关系 表达 式 (在 这 个 例子 中 ，x 的 值 是 执行 这 条 语句 时 y 的 值 )。 实 际 上 
这 是 三 项 设计 决策 导致 的 结果 : 允许 赋值 具有 一 般 二 元 操作 符 的 行为 ， 像 使 用 布尔 操作 数 一 样 
使 用 算术 表达 式 ， 以 及 使 用 两 个 非常 相似 的 操作 符 ，= 和 ==， 来 表达 完全 不 同 的 意义 。 这 是 C 
及 C++ 的 程序 缺乏 安全 性 的 另 一 个 例子 。 注 意 ，Java 和 C# 在 它们 的 if 语 句 中 只 允许 boolean 表 
达 式 ， 从 而 不 会 出 现 这 样 的 问题 。 


7.7.6 “列表 赋值 


包括 Perl 和 Ruby 等 一 些 最 近 的 程序 设计 语言 提供 了 多 目标 、 多 源 赋值 语句 。 例 如 ， 在 Perl 中 
编写 如 下 语句 : 

($first, $second, Sthird) = (20, 40, 60); 

它 的 语义 是 ， 把 20 赋 值 给 $Sfirst， 把 40 赋 值 给 Ssecond， 以 及 把 60 赋 值 给 Sthird。 如 果 
两 个 变量 的 值 是 相互 交换 的 ， 可 以 用 一 条 简单 的 赋值 语句 完成 ， 正 如; 

($first, $second) = ($second, $first); 

这 就 正确 地 完成 了 $first 和 $second 的 值 交换 ， 而 没有 使 用 临时 变量 (至 少 有 一 个 由 程 
序 创建 和 管理 的 变量 )。 

在 Perl 中 ， 如 果 右 边 的 值 的 个 数 多 于 左边 变量 的 个 数 ， 那 么 将 忽略 多 余 的 值 。 如 果 左 边 变 
量 的 个 数 多 于 右边 值 的 个 数 ， 那 么 多 余 的 变量 设置 为 undef 。 如 果 左 边 包 括 一 个 数组 名 ， 那 么 
该 数组 得 到 所 有 右边 剩 下 的 值 。 如 果 在 左边 有 任何 变量 跟 在 数组 名 之 后 ， 那 么 它们 都 将 设置 为 
undef, 

Ruby 列 表 赋 值 的 最 简单 形式 的 语法 与 Penl 的 相 类 似 ， 除 了 左边 和 右边 没有 括 入 括 绝 内 之 外 。 
Ruby 也 包括 了 一 些 这 里 没有 讨论 的 、 更 加 详尽 的 列表 赋值 形式 。 

7.8 混合 模式 赋值 

我 们 曾经 在 第 7.4.1 市 讨论 了 混合 模式 表达 式 。 通 常 ， 赋 值 语句 也 是 混合 模式 的 。 它 的 设计 
问题 是 : 表达 式 的 类 型 必须 与 被 赋值 的 变量 的 类 型 相同 吗 ? 或 者 ， 能 够 将 强制 类 型 转换 用 于 某 
些 类 型 不 匹配 的 情形 吗 ? 

Fortran、C、C++ 和 Perl 对 于 混合 模式 赋值 使 用 强制 转换 规则 ， 与 那些 在 混合 模式 表达 式 中 
使 用 的 规则 十 分 类 似 ， 也 就 是 说 ， 许 多 可 能 类 型 的 混合 是 合法 的 ， 强 制 转 换 可 以 无 限制 地 使 
用 。° Ada 不 允许 混合 模式 赋值 。 

通过 一 种 与 C 和 C++ 明 显 不 同 的 方式 ，Java 和 C# 只 有 在 所 需 的 强制 转换 为 宽 化 转换 时 ， 才 人 允 
许 混合 模式 赋值 。” 因此， 可 以 将 一 个 int 值 赋 给 一 个 fl10at 变 量 ， 反 之 却 不 然 。 禁 止 可 能 芯 
为 一 半 泥 合 模式 赋值 ， 是 Java 和 C# 采 用 的 一 种 简单 有 效 的 方法 。 相 对 于 C 和 C++ 而 言 ， 这 种 方法 
提高 了 Java 和 C# 的 可 靠 性 。 

在 所 有 允许 混合 模式 赋值 的 语言 中 ， 强 制 转换 仅 发 生 在 右边 的 表达 式 被 计算 之 后 。 一 种 替 
代 方 案 是 : 在 计算 之 前 ， 将 所 有 的 右边 操作 数 都 强制 为 目标 类 型 。 例 如 ， 考 虑 下 面 的 代码 ; 


int a, b; 


O 注意 在 Python 和 Ruby 中 ， 类 型 与 对 象 相关 联 ， 而 不 是 变量 ， 因 此 在 这 些 语言 中 ， 没 有 混合 模式 赋值 等 操作 。 

O 并 不 是 完全 正确 的 : 如 果 由 编译 器 默认 赋值 类 型 为 int 的 整数 字 而 常量 赋值 给 char、byte 或 short 变 量 ， 
而 且 字 面 沼 量 在 变量 类 型 的 范围 之 内 ， 那 么 在 案 化 转换 中 把 int 值 强制 转换 成 变量 的 类 型 。 这 种 罕 化 转换 
不 会 引起 错误 。 
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float c; 


337 cma tb 
因为 c 是 浮 点 数 ， 因 而 可 以 在 除法 操作 之 前 ， 将 a 和 b 的 值 强制 转换 为 Eloat ， 这 样 较 之 延 
述 强制 转换 的 情形 ， 将 会 产生 不 同 的 c 值 (例如 ， 如 果 a 为 2，b 为 3)。 


小 结 


表达 式 由 常量 、 变 量 、 括 号 、 函 数 调用 和 操作 符 组 成 。 赋 值 语 句 包括 目标 变量 、 赋 值 操作 符 以 及 表 
js 

表达 式 的 语义 在 很 大 程度 上 由 操作 符 的 求 值 顺 序 决定 。 一 种 语言 表达 式 中 的 操作 符 的 结合 性 和 优先 级 
规则 决定 在 这 些 表达 式 中 操作 符 的 求 值 顺序 。 如 果 可 能 具有 函数 的 副作用 ， 操 作 数 的 求 值 顺序 则 十 分 重要 。 
类 型 转换 可 以 是 宽 化 的 或 者 窗 化 的 。 某 些 窗 化 转换 将 产生 错误 的 数值 。 隐 式 类 型 转换 (或 强制 转换 ) 在 表 
达 式 中 十 分 常见 ， 但 它 抵消 了 类 型 检测 发 现 错误 的 好 处 ， 从 而 导致 可 靠 性 降低 。 

赋值 语句 以 多 种 形式 出 现 ,包括 条 件 目标 、 多 目标 以 及 赋值 操作 符 。 


复习 题 


1. 定义 操作 符 优先 级 和 操作 符 结 合 性 。 

2. 定义 函数 的 副作用 。 

3. 什么 是 强制 转换 ? 

4. 什么 是 条 件 表 达 式 ? 

5. 什么 是 重 载 的 操作 符 ? 

6. 定义 窗 化 转换 和 宽 化 转换 。 

7. 什么 是 混合 模式 表达 式 ? 

8. 操作 数 的 求 值 顺序 与 函数 的 副作用 有 什么 相互 影响 ? 

9. 什么 是 短路 求 值 ? 

10. 指出 一 种 总 是 进行 布尔 表达 式 上 的 短路 求 值 的 语言 。 指 出 一 种 从 不 进行 短路 求 值 的 语言 。 指 出 一 种 多 
许 程序 人 员 选 择 是 否 进 行 短路 求 值 的 语言 。 

11. C 是 怎样 支持 关系 表达 式 和 布尔 表达 式 的 ? 

12. 复合 赋值 操作 符 的 目的 是 什么 ? 

13.C 中 一 元 算术 操作 符 的 结合 性 是 什么 ? 

338) 14. 将 赋值 操作 符 处 理 为 算术 操作 符 时 ， 会 有 哪 种 可 能 的 缺点 ? 

15. 哪 两 种 语言 包含 列表 赋值 ? 

16. 在 Ada 中 人 允许 什么 样 的 混合 模式 赋值 ? 

17. 在 Java 中 允许 什么 样 的 混合 模式 赋值 ? 


练习 题 


1. 你 在 什么 时 候 可 能 希望 编译 器 忽略 表达 式 中 的 不 同类 型 ? 

2. 表述 你 对 允许 混合 模式 算术 表达 式 的 看 法 ， 分 别 给 出 支持 以 及 反对 它 的 论点 。 
3. 你 认为 在 你 喜爱 的 语言 中 取消 重 载 操作 符 会 有 益 吗 ?为 什么 会 有 益处 ?或 者 为 什么 没有 益处 ? 

4. 取消 所 有 操作 符 的 优先 级 规则 ， 并 要 求 用 括号 表示 表达 式 中 所 需 的 优先 级 ， 这 是 不 是 一 个 好 主意 ? 并 
给 出 理由 。 

5. 应 该 将 C 的 赋值 操作 〈 例 如 +=) 引入 其 他 的 语言 吗 ? 为 什么 ?请 给 出 理由 。 

6. 应 该 将 C 的 单一 操作 数 赋值 形式 (例如 ++count) 引入 其 他 的 语言 吗 ? 为 什么 ?请 给 出 理由 ， 


7. 描述 一 种 程序 设计 语言 中 的 加 法 操作 符 不 可 交换 的 情形 。 
8. 摘 述 一 种 程序 设计 语言 中 的 加 法 操作 符 不 可 结合 的 情形 。 
9. 假设 存在 下 列 的 表达 式 结合 性 与 优先 级 规则 : 


优先 级 : 最 高 *, /, not 
+, -, &, mod 
=( 一 元 的 ) 
=. (=, <; <=, >=, > 
and 
最 低 or, xor 


At 


吉 合 性 : Kk ENG 

遂 过 将 所 有 的 子 表达 式 加 上 括号 ， 并 在 其 右 括号 的 上 方 加 上 指示 顺序 的 上 标 ， 以 指出 表达 式 的 求 值 顺 
序 。 例 如 ， 对 表达 式 

atb*evr#tad 

可 以 将 它 的 求 值 顺序 表示 为 

((a + {b * c)? + d)? 
请 指出 下 列表 达 式 的 求 值 顺序 : 

aar* b-1l+e 

b.a * (b- 1) / c mod d 

& (amip) Fic ik (da * @ / ala 3) 
d. -a or c = d and e 

e. a > b xor c or d <= 17 

f. sa +b 


10. 显示 练习 题 9 中 表达 式 的 求 值 顺序 ， 假 设 不 存在 优先 级 规则 ， 并 且 所 有 的 操作 符 都 是 从 右 到 左 结合 的 。 
11. 为 练习 题 9 中 定义 的 表达 式 写 出 一 个 优先 级 规则 以 及 结合 性 规则 的 BNF 描 述 ， 假 设 ， 仅 有 的 操作 数 名 称 
分 别 为 a8，b，c，d 和 和 e。 
12. 使 用 练习 题 11 中 的 文法 ， 为 练习 题 9 中 的 表达 式 画 出 语法 分 析 树 。 
13. 定义 函数 fun 为 
int fun(int *k) { 
*k += 4; 
return 3 * (*k) - 1; 
} 


(Bie AEP TA AY Be A HIEN fun pa Be 
void main() { 
int i= 10, j = 10, suml, sum2; 


suml = (i / 2) + fun(&i); 
sum2 = fun(&j) + (j / 2); 
} 
suml 与 sum2 的 值 分 别 是 什么 ? 


a. 如 采 表 达 式 中 的 操作 数 是 以 从 左 到 右 的 顺序 来 求 值 的 ? 
b. 如 采 表 达 式 中 的 操作 数 是 以 从 右 到 左 的 顺序 来 求 值 的 ? 

14. 你 反对 (或 者 支持 ) APL 中 操作 符 优先 级 规则 的 主要 论点 是 什么 ? 

15. 为 你 选择 的 某 种 语言 编写 一 组 操作 符 ， 使 用 这 些 操作 符 可 以 消除 所 有 的 操作 符 重 载 、 

16. 很 据 你 所 知道 的 两 种 语言 ， 当 一 个 被 转换 的 值 失 去 了 它 的 用 途 时 ， 确 定 是 不 是 所 使 用 的 罕 化 显 式 类 型 
转换 提供 了 错误 的 信息 。 
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340] 17. 应 该 允许 C 或 C++ 的 优化 编译 器 改变 布尔 表达 式 中 的 子 表达 式 的 顺序 吗 ? 为 什么 ?请 给 出 理由 。 
18. 针对 Ada 语 言 回答 练习 题 17 中 的 问题 。 
19. 考虑 下 面 的 C 程 序 : 
int fun(int *i) { 
ži += 5; 
return 4; 
} 
void main() { 
int x = 3; 
x = x + fun(&x); 


} 


在 main 中 的 赋值 语句 之 后 ，x 的 值 是 什么 ? 假设 
a. 操作 数 是 以 从 左 到 右 的 顺序 来 求 值 的 。 
b. 操作 数 是 以 从 右 到 左 的 顺序 来 求 值 的 。 
20. 为 什么 Java 语 言 指定 其 表达 式 中 所 有 操作 数 的 求 值 都 按照 从 左 到 右 的 顺序 ? 


程序 设计 练习 题 


1. 在 某 种 支持 C 语 言 的 系统 上 ， 运 行 练习 题 13 中 给 出 的 代码 ， 以 确定 suml 与 sum2 的 值 。 解 释 你 的 结果 。 
2. 使 用 C++，Java 以 及 C# 语 言 重 新 编写 程序 练习 题 1] 中 的 程序 ， 运 行 这 些 程序 ， 并 且 比 较 它 们 的 结果 。 
3. 使 用 你 所 喜爱 的 一 种 语言 来 编写 一 个 测试 程序 。 这 个 程序 将 确定 并 且 输 出 这 种 语言 中 的 算术 操作 符 以 
及 布尔 操作 符 的 优先 级 和 结合 性 。 
4. 编写 一 个 Ada 程 序 来 说 明 mod 与 rem 之 间 的 差别 。 包 括 使 用 各 种 正 的 及 负 的 操作 数 。 
5. 编写 一 个 Java 程 序 以 揭示 Java 中 操作 数 的 求 值 顺序 ， 条 件 是 其 中 的 一 个 操作 数 是 方法 调用 。 
6. 使 用 C++ 重复 程序 练习 题 5。 
7. 使 用 C# 重 复 程序 练习 题 5。 
8. 编写 一 个 C++、Java 或 者 C# 程 序 ， 说 明 使 用 表达 式 作为 一 个 方法 中 的 实 参 时 的 求 值 顺序 。 
9. 编写 一 个 C 程 序 ， 包 括 了 下 面 的 语句 : 
int a, b; 
341 a= 10; 
b = a + fun(); 
printf("With the function call on the right"); 
printft("b is: td\n", b}? 
a = 10; 
b = fun() + a; 4 
printf("With the function call on the left"); 
printt("b is: %d\n", b)? 


并 且 将 fun 定 义 为 给 a 加 10。 解 释 你 的 结果 。 
342] 10. 编写 一 个 C# 程 序 以 确定 C# 是 否 使 用 了 Java 的 操作 数 求 值 顺序 规则 。 


AIS ”语句 层次 的 控制 结构 


关于 程序 中 的 控制 流程 或 执行 序列 ， 可 以 从 几 个 层次 上 进行 研究 。 我 们 在 第 7 章 中 曾经 讨论 
了 表达 式 中 的 控制 流程 ， 它 受 操作 符 的 结合 性 以 及 优先 级 规则 的 支配 。 位 于 最 高 层次 的 是 程序 
单元 之 则 的 控制 流程 ， 我 们 将 在 第 9 章 和 第 13 章 里 进行 讨论 。 在 这 两 个 极端 层次 之 间 ， 是 极为 重 
要 的 语句 间 的 控制 流程 问题 ， 这 就 是 本 章 的 主题 。 

我 们 将 从 命令 式 程 序 设计 语言 的 控制 语句 的 发 展 概况 开始 ， 接 着 再 对 选择 结构 进行 透彻 的 
研究 ， 包 括 单 向 、 双 向 以 及 多 路 选择 结构 ， 随 后 讨论 程序 设计 语言 中 开发 和 应 用 的 多 种 循环 结 
构 ， 然 后， 我 们 将 简略 地 讨论 具有 争议 的 无 条 件 转移 语句 ， 最 后 描述 守卫 的 命令 的 控制 结构 。 


8.1 概述 


在 命令 式 语 言 程序 中 的 运算 是 通过 对 表达 式 求 值 以 及 将 值 赋 给 变量 来 完成 的 。 然 而 ， 只 有 
极 少 的 程序 完全 是 由 赋值 语句 组 成 的 。 至 少 需 要 两 种 额外 的 语言 机 制 ， 才 能 够 使 程序 中 的 计算 
足够 灵活 且 有 效率 : 一 种 是 在 可 能 的 控制 流程 (语句 执行 的 ) 路 径 中 进行 选择 的 方法 ， 另 一 种 
是 引起 某 些 语 名 顺序 重复 执行 的 方法 。 我 们 称 提供 这 类 功能 的 语句 为 控制 语句 。 

第 一 种 成 功 的 程序 设计 语言 Fortran 中 的 控制 语句 实际 上 是 由 IBM 704 机 器 的 设计 人 员 设计 
的 。 这 种 语言 完全 直接 与 机 器 语言 的 指令 相关 联 ， 因 而 它们 的 功能 更 像 是 来 自 指令 的 设计 ， 而 
不 古来 自 语 言 的 设计 。 当 时 编写 程序 的 困难 鲜 为 人 知 ， 结 果 在 20 世 纪 50 年 代 后 期 ， 人 们 完全 地 
接受 了 Fortran 中 的 控制 语句 。 如 果 按 照 现 在 的 标准 ， 这 些 控制 语句 根本 不 能 够 被 使 用 。 

丛 20 世纪 60 年 代 中 期 至 70 年 代 中 期 的 这 10 年 间 ， 在 控制 语句 的 问题 上 集中 了 大 量 的 研究 与 
讨论 。 这 些 工作 所 得 出 的 主要 结论 之 一 是 ， 虽 然 单个 控制 语句 (可 选择 的 goto 语 句 ) 在 最 小 的 
限度 上 已 经 足够 使 用 ， 但 是 设计 一 种 不 包括 goto 语 句 的 语言 ， 也 仅仅 需要 少数 几 条 不 同 的 控制 
语句 。 事 实 已 经 证 明 ， 所 有 能 够 由 流程 图 表述 的 算法 都 能 够 使 用 两 种 控制 语句 在 程序 设计 语言 
中 编码 : 一 种 是 在 两 条 控制 流程 路 径 之 间 的 选择 语句 ， 第 二 种 是 逻辑 控制 的 循环 语句 (Bohm 
和 Jacopini，1966)。 这 里 的 一 个 重要 结论 是 ， 无 条 件 转移 语句 是 多 余 的 ， 它 可 能 很 方便 ， 但 却 
不 是 绝对 必要 的 。 这 种 事实 结合 使 用 无 条 件 转移 ( 即 goto) 中 的 问题 ， 导致 了 大 量 关 于 goto 
语句 的 争论 ， 我 们 将 在 8.4.1 节 中 讨论 这 个 问题 。 

程序 人 员 对 于 可 写 性 与 可 读 性 的 关注 远 胜 过 对 控制 语句 的 理论 研究 结果 。 所 有 广泛 应 用 的 
语言 都 包含 了 多 于 两 种 最 基本 控制 语句 的 控制 语句 数目 ， 因 为 大 量 的 控制 语句 提高 了 可 写 性 、 
例如 ， 并 不 要 求 对 所 有 的 循环 都 使 用 while 语 句 ， 而 可 以 使 用 for 语 句 来 建立 循环 ， 而 这 种 特 
环 人 在 可 以 自然 地 用 计数 器 来 控制 时 将 会 相对 容易 。 限 制 语言 中 的 控制 语句 数目 的 主要 原因 是 语 
言 的 可 读 性 ， 因 为 大 量 的 语句 形式 将 使 得 程序 的 阅读 人 员 需 要 学 习 较 大 型 的 语言 。 很 少 有 人 真 
正 学 习 过 一 种 大 型 语言 的 全 部 内 容 ， 人 们 通常 仅 学 习 使 用 语言 的 一 个 子 集 ， 而 这 个 子 集 又 常 党 
与 程序 人 员 使 用 的 子 集 不 尽 相 同 。 另 外 ， 控 制 语 句 太 少 会 导致 人 们 使 用 较 低层 次 的 语句 ， 如 
goto 语 句 ， 这 将 降低 程序 的 可 读 性 。 

入 们 曾经 就 能 够 提供 所 需 功 能 的 最 佳 控制 语句 的 集合 ， 以 及 语言 所 需要 的 可 写 性 问题 进行 
过 三 泛 的 讨论 。 实 质 上 ， 这 就 是 这 样 一 个 问题 ， 如 果 以 一 种 语言 的 简单 性 、 规 模 以 及 可 读 性 作 


Qə 


230 PSF 


为 代价 ， 究 竟 可 以 将 这 种 语言 扩展 到 什么 样 以 增加 语言 的 可 写 性 。 

控制 结构 就 是 一 条 控制 语句 加 上 受 这 条 语句 控制 执行 的 一 组 语句 。 

所 有 的 选择 语句 以 及 循环 控制 语句 都 存在 这 样 一 个 设计 问题 : 控制 结构 应 该 具有 多 个 入 口 
吗 ? 所 有 的 选择 语句 以 及 循环 语句 都 控制 着 代码 段 的 执行 ， 问 题 是 ， 是 否 总 是 从 代码 段 的 第 一 
条 语句 开始 代码 的 执行 。 现 在 人 们 普遍 相信 ， 多 个 人 口 并 没有 增加 多 少 控制 结构 的 灵活 性 ， 反 
而 由 于 所 增加 的 复杂 程度 降低 了 语言 的 可 读 性 。 请 注意 ， 只 有 在 包括 了 goto 语 句 以 及 语句 标号 
的 语言 中 ， 多 个 人 口才 成 为 可 能 。 

在 这 里 ， 也 许 读者 会 问 : 为 什么 我 们 疫 有 把 控制 结构 的 多 个 出 口 列 为 一 个 设计 问题 。 原 因 
是 ， 所 有 的 程序 设计 语言 都 允许 从 控制 结构 中 形成 一 些 形式 的 多 个 出 口 ， 合 理 的 解释 如 下 : 如 
采 控 制 结 构 的 所 有 出 口 都 被 限制 到 对 结构 之 后 的 第 一 个 语句 的 传送 控制 〈 假 如 控制 结构 没有 显 
式 的 出 口 ， 控 制 将 流动 )， 那 么 对 可 读 性 没有 害处 ， 也 没有 危险 。 然 而 ， 如 果 出 口 有 未 限制 的 目 
标 ， 并 能 引发 控制 传送 到 包含 控制 结构 的 程序 单元 的 任何 地 方 ， 那 么 它 对 可 读 性 的 损害 与 在 程 
序 中 到 处 使 用 goto 语 句 是 相同 的 。 有 goto 语 句 的 语言 允许 它 出 现在 包括 在 控制 结构 里 的 任何 
地 方 。 然 而 ， 问 题 是 包含 goto 语 句 ， 而 不 是 控制 结构 的 多 个 出 口 是 否 受 人 允许。 


8.2 选择 语 名 


选择 语句 在 程序 中 提供 在 两 个 或 者 多 个 执行 路 径 之 间 进 行 选择 的 方法 。 这 种 语句 是 所 有 程 
序 设计 语言 中 基本 且 必 要 的 部 分 ， 正 如 B6hm 和 Jacopini 曾 经 证 明 过 的 。 选 择 语句 被 归纳 为 两 种 
普通 的 类 型 : 双 同 选择 与 多 向 选择 。 双 向 选择 将 在 第 8.2.1 节 中 讨论 ， 多 向 选择 将 在 第 8.2.2 节 中 
讨论 。 


8.2.1 双 问 选择 语 和 名 


虽然 当代 命令 式 语 言 中 的 双向 选择 语句 十 分 相似 ， 但 是 它们 有 一 些 变动 。 一 个 双向 选择 器 
的 一 般 形式 为 

if 控制 语句 

then 子 句 

else 子 句 

8.2.1.1 设计 问题 

可 以 将 双向 选择 器 的 有 关 设 计 问 题 总 结 如 下 : 


历史 注释 © 控制 选择 的 表达 式 的 形式 及 其 类 型 是 什么 ? 


RI” HA MRE, RABE © DIZ TERE Ue WA EE EA EL 
器 使 用 一 条 算术 表达 式 来 施行 控 8.2.1.2 控制 表达 式 
制 。 取 决 于 这 条 控制 表达 式 的 值 基于 C 的 语言 不 使 用 保留 字 then (或 一 些 其 他 语法 标 


完 竟 是 页 数 、 零 值 还 是 正 数 ， 它 id) 来 引出 then 子 句 ， 而 是 将 控制 表达 式 放 在 括号 中 。 在 使 
将 号 致 控制 流向 三 条 不 同 标记 的 。 ”用 保留 字 then (或 可 替代 的 标记 ) 的 情形 中 ， 就 不 再 需要 
语 向 中 的 一 条 。 这 种 语 向 被 列 在 。 ”括号 了 。Ada 语 言 中 常常 将 括号 省 略 掉 。 

Fortran 95 中 将 被 废弃 的 特性 表 C89 不 具有 布尔 数据 类 型 ， 因 而 使 用 算术 表达 式 作 为 控 
oe | 制 表 达 式 。 在 C99 和 C++ 语言 中 也 是 这 样 。 然 而 在 这 些 语言 
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中 ， 可 以 同时 使 用 算术 表达 式 和 布尔 表达 式 作 为 控制 表达 式 。 但 在 其 他 的 当代 语言 中 ， 如 Ada， 
Javal 及 C#， 就 只 能 使 用 布尔 表达 式 作 为 控制 表达 式 。 

8.2.1.3 子 句 形式 

在 大 多 数 的 当代 语言 中 ，then 子 句 以 及 else 子 句 可 以 是 简单 语句 也 可 以 是 复合 语句 。 但 
Perl 语 言 是 一 个 例外 ，Perl 中 所 有 的 then 和 else 子 句 都 必须 是 复合 语句 ， 哪 怕 代 码 仅 仅 包括 了 
一 条 语句 。 在 基于 C 的 语言 以 及 在 Perl，JavaScript 和 PHP 中 ， 是 使 用 大 括号 构成 复合 语句 ， 这 作 
为 then 子 句 和 else 子 句 的 主要 部 分 。 在 Fortran 95. Ada. Python 和 Ruby 中 ，then 子 句 和 
else 子 句 是 语句 序列 。 完 整 的 选择 结构 在 Fortran 95、Ada 和 Ruby 中 用 保留 字 终 止 掉 了 。。 

Python 使 用 缩 进来 指定 复合 语句 。 例 如 ， 

二 

A = Y 
print “case 1” 

在 复合 语句 中 ， 所 有 语句 都 有 相同 的 缩 进 量 。。 注意 ， Python 使 用 冒号 来 引入 then 子 句 ， 
而 不 仅仅 是 then.。 

于 句 形式 的 变化 表示 艇 套 选 择 器 意义 的 指定 ， 下 一 小 节 将 讨论 这 部 分 内 容 。 

8.2.1.4 ReneS 

回顾 第 3 章 的 双向 选择 结构 的 文法 的 语法 歧义 性 问题 。 文 法 如 下 ， 

<if_stmt> > if <logic_expr> then <stmt> 

| if <logic_expr> then <stmt> else <stmt> 

问题 是 ， 当 选择 结构 嵌 套 在 选择 结构 的 then 子 句 时 ， 是 否 应 该 关联 一 个 else 子 句 是 不 明 

确 的 。 这 个 问题 反映 在 选择 语句 的 语义 中 。 考 虑 下 面 类 似 Java 的 代码 ， 


if (sum == 0) 
if (count == 0) 
result = 0; 
else 
result = 1; 


根据 e1se 子 句 是 与 第 一 个 then 子 句 还 是 与 第 二 个 then 子 句 相 匹配 ， 可 以 有 两 种 不 同 的 方 


Mi, BR 了 Python 之 外 ， 程 序 缩 进 对 大 部 分 当代 语言 的 语义 并 不 产生 影响 ， 因 此 编译 器 将 忽略 

在 这 个 例子 中 ， 问 题 的 关键 是 : else 子 句 跟随 在 两 个 then 子 名 之后。 而 没有 另 一 个 
else 了 于 名 帮助 说 明 它 与 其 中 的 哪 一 个 then 子 句 相 匹 配 ， 并 且 也 没有 语法 指示 器 来 说 明 
else 了 于 名 与 其 中 的 哪 一 个 then 子 句 相 匹 配 。 在 Java 中 ， 也 如 同 在 许多 其 他 的 命令 式 语言 
中 一 样 ， 语 言 的 静态 语义 说 明 else 子 句 总 是 与 最 靠近 的 没有 配对 的 then 子 句 相 匹配 。 一 
条 规则 在 这 里 被 用 来 起 到 消除 歧义 的 作用 。 因 而 在 上 面 的 例子 中 ， 这 一 条 else 子 句 将 是 
第 二 条 then 子 句 的 匹配 语句 。 使 用 一 条 规则 而 非 一 个 语法 实体 ， 它 所 具有 的 缺点 是 ， 尽 
党 程序 人 员 可 能 希望 else 子 名 作为 第 一 条 then 子 句 的 匹配 语句 ， 并 且 编 译 器 也 将 发 现 这 
种 语法 结构 是 正确 的 ， 但 它 的 语义 却 不 然 。 为 了 在 Java 中 强制 这 种 替代 语义 ， 需要 一 种 不 
同 的 语法 形式 ， 在 这 种 形式 中 ， 内 层 的 if 被 放 入 一 个 复合 语句 中 ， 例 如 

昌 实际 上 ， 在 Ada 和 Fortran 中 有 两 个 保留 字 : end if (Ada) 或 End if (Fortran), 

O 复合 语句 后 面 的 语句 必须 有 与 if 相同 的 缩 进 。 
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历史 注释 


ALGOL 60 的 设计 人 员 选 择 
使 用 语法 而 不 是 规则 来 进行 
else f 4) fethen F 4 H##, 
HHA, BAHL FAK 
套 于 then 子 向 之 中 。 如 果 必 须 
将 一 条 if 语 和 句 谋 套 于 一 条 then 
子 负 的话 ， 则 必须 将 if 语 向 放 置 
在 一 条 复合 语句 之 内 。 例 如 后 面 
的 Java 例 子 。 

这 两 种 设计 之 间 的 不 同 在 于 


Java 版 本 允许 人 们 编写 KEN 
择 器 ， 看 上 去 ， 这 种 选择 器 似乎 


将 else 子 身 与 第 一 条 then 子 向 
相配 对 ， 但 实际 上 却 不 是 ; 然而 
在 ALGOL 60 中 ,这 种 形式 在 语 
法 上 是 不 合法 的 ， 因 此 不 会 允许 
出 现 Java 中 的 错 综 问 题 。 
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if (sum == 0) { 
if (count == 0) 
result = 0; 
} 
else 
result = 1; 


C、C++ 和 C# 具 有 与 Java 一 样 的 选择 语句 骨 套 问题 。 
Perl 要 求 所 有 的 then 子 句 都 与 el1se 子 句 复合 ， 由 此 避免 了 
所 有 的 这 些 问 题 。 在 Perl 中 可 以 将 前 面 的 代码 写 为 


if (sum == 0) { 
if (count == 0) { 
result = 0; 
} 
} else { 
result = 1; 


} 
如 采 需 要 另外 一 种 语义 的 话 ， 这 段 代 码 就 可 以 成 为 


if (sum == 0) { 
if (count == 0) { 
result = 0; 
} 
else { 
result = 1; 
} 
} 
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Java 中 if 语 句 的 语法 结构 。then 子 句 跟随 着 中 心 表达 式 ，else 子 句 则 由 保留 字 else 引 入 。 当 
then 子 名 为 单条 语句 ， 并 且 有 else 子 句 时 ， 尽 管 并 不 需要 在 语句 的 结尾 作 标 记 , “但 事实 上 ， 
保留 字 else 标 记 了 then 子 句 的 结束 。 当 then 子 句 为 复合 语句 时 ， 它 由 一 个 右 花 括号 结束 。 然 
而 ， 如 采 if£ 语 句 中 的 最 后 一 个 子 句 ， 无 论 是 then 子 句 还 是 else 子 句 ， 不 是 复合 语句 的 话 ， 就 
没有 语法 实体 来 标记 整个 选择 结构 的 结束 。 用 于 这 种 目的 的 特殊 字 将 解决 内 套 选 择 器 的 语义 问 
题 ， 并 且 增 加 这 种 结构 的 可 读 性 。 这 就 是 Fortran 95、Ada 和 Ruby 中 对 于 选择 结构 的 设计 。 例 如 ， 
考虑 下 面 的 Ruby 结 构 : 
if a > b then 
sum = sum + a 
acount = acount + 1 
else 
sum = sum + b 


bcount = bcount + 1 
end 


这 个 选择 结构 的 设计 比 基 于 C 的 语言 中 的 选择 结构 更 为 规则 ， 因 为 不 论 在 then 子 句 和 
else 子 名 里 的 语句 数目 是 多 少 ， 它 们 的 形式 都 是 相同 的 (这 对 Perl 也 是 正确 的 ) 。 回 顾 在 Ruby 
中 ， 这 些 子 句 包含 的 是 语句 序列 ， 而 不 是 复合 语句 。 对 于 在 第 8.2.1.4 节 (else 子 句 与 修 套 if 
相 匹 配 ) 开始 时 选择 器 例子 的 第 一 种 解释 ， 可 以 编写 成 为 下 面 的 Ruby 程 序 : 


if sum == 0 then 
if count == 0 then 
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result = 0 
else 
result = 1 
end 
end 


因为 保留 字 end ifkA SRmEWIL, DA, elsefW5SANRMthen+AALEC. 
对 于 在 第 8.2.1.4 节 中 选择 器 例子 的 第 二 种 解释 ，else 子 句 与 外 部 if 相 匹 配 ， 也 可 以 编写 成 
下 面 的 Ruby 程 序 : 


if sum == 0 then 
if count == 0 then 
result = 0 
end 
else 
result = 1 
end 


下 面 用 Python 编写 的 结构 与 上 面 的 Ruby 结 构 在 语义 上 是 等 价 的 : 


if sum == 0 : 
if count == 0 : 
result = 0 
else: 
result = 1 


MRelse : HB) KEI fE — WFP, elsef- WHR SAMIEM LEA, 
8.2.2 多 问 选 择 结构 


多 问 选 择 结构 允许 在 任意 数目 的 语句 或 语句 组 中 进行 一 种 选择 。 因 而 它 是 选择 器 的 一 种 一 
般 化 形式 。 事 实 上 ， 可 以 由 一 个 多 向 选择 器 来 构造 一 个 双向 选择 器 。 

在 程序 中 ， 常 党 需要 在 多 于 两 条 控制 路 径 中 进行 选择 。 虽 然 多 向 选择 器 也 可 以 使 用 双向 选 
择 器 和 goto 语 句 来 构造 ， 但 这 样 产生 的 结构 却 很 不 方便 ， 并 且 难 以 编写 与 阅读 ， 还 不 大 可 靠 。 
因此 很 显然 ,我 们 需要 有 一 种 特殊 的 结构 。 

8.2.2.1 设计 问题 

多 同 选 择 句 的 一 些 设计 问题 与 某 些 双向 选择 器 的 问题 相 类 似 。 例 如 其 中 的 一 个 问题 是 选 
择 句 基于 的 表达 式 的 类 型 问题 。 在 这 种 情况 下 可 能 值 的 范围 很 大 ， 部 分 原因 是 可 以 选择 的 数 
目 比 较 大 。 一 个 双向 选择 器 需要 表达 式 能 够 具备 两 种 可 能 的 值 。 另 一 个 问题 是 ， 当 选择 结构 
饺 执行 时 ， 是 否 可 以 选择 单条 语句 、 复 合 语句 或 者 语句 序列 。 再 接 下 来 的 问题 是 ， 当 执行 选 
择 结构 时 ， 是 否 可 以 执行 单个 可 选择 段 。 这 对 于 双向 选择 器 不 是 一 个 问题 ， 因 为 所 有 的 设计 
都 只 允许 执行 期 间 在 一 条 控制 路 径 上 只 有 一 条 子 句 。 正 如 我 们 将 要 看 到 的 ， 对 于 多 向 选择 器 
问题 的 这 种 解决 办 法 ， 在 可 靠 性 与 灵活 性 之 间 取得 了 一 种 平衡 。 另 一 个 问题 是 case 值 的 形式 。 
最 后 的 一 个 问题 是 ， 如 果 选 择 器 表达 式 的 计算 产生 了 一 个 数值 ， 而 这 个 数值 不 是 选择 段 所 具 ”[350 
有 的 ， 这 将 会 导致 什么 样 的 结果 (这 个 数值 没有 被 选择 段 所 表示 ) 。 这 里 可 能 的 选择 仅仅 是 ， 
不 允许 这 种 情况 出 现 ， 当 这 种 情况 确实 出 现时 ， 程 序 结构 就 不 执行 任何 事情 。 

下 面 是 关于 这 些 设计 问题 的 一 个 总 结 : 

* 控制 选择 过 程 的 表达 式 的 形式 与 类 型 是 什么 ? 

“怎样 来 说 明 可 选择 段 ? 

© 应 该 将 穿 过 结构 的 执行 流程 限制 于 只 能 包括 单个 的 可 选择 段 吗 ? 
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。 怎 样 指定 case 值 ? 
。 如 采 出 现 了 任何 未 被 选择 器 的 表达 式 所 表示 的 数值 ， 应 该 怎样 处 理 ? 
8.2.2.2 多 问 选 择 器 示例 
C 中 的 多 向 选择 器 构造 switch 也 是 C++、Java 和 JavaScript 语 言 中 的 一 部 分 ， 它 是 一 种 相对 
原始 的 设计 。 它 的 一 般 形 式 为 
switch (表达 式 ) { 
case 常量 表达 式 1: 语句 _ 1，; 


case 常量 表达 式 _n: 语句 n; 
[default: 语句 _n+1] 
} 


这 里 的 控制 表达 式 和 常量 表达 式 都 为 某 种 整数 类 型 。 而 可 选择 语句 则 可 以 是 语句 序列 、 复 
合 语 句 或 者 块 。 可 选择 的 default 段 用 于 控制 表达 式 产 生 的 那些 不 代表 任何 可 选择 段 的 值 。 如 
末 控 制 表 达 式 的 值 没有 代表 任何 可 选择 段 ， 而 且 当 前 没有 默认 段 ， 这 个 结构 将 不 做 任何 事情 。 

Switch 语句 允许 多 个 人 口 ， 并 且 在 代码 段 结尾 不 提供 隐 式 分 支 。 这 样 就 允许 控制 流程 在 
一 次 执行 中 军 过 多 个 可 选择 的 代码 段 。 考 虑 下 面 的 例子 

switch (index) { 

case 1: 
case 3: odd += 1; 
sumodd += index; 
case 2: 
case 4: even += 1; 
sumeven += index; . 
default: printf("Error in switch, index = $d\n", index); 

} 

在 每 一 次 执行 这 段 代码 时 ， 都 会 打印 出 错 信息 。 类 似 地 ， 每 一 次 在 执行 常量 1 和 3 位 置 的 代 
码 时 ， 常 量 2 和 4 处 的 代码 也 被 执行 。 为 了 能 够 逻辑 地 分 离 这 些 代码 段 ， 就 必须 包括 一 种 显 式 分 
支 。break 语 句 实质 上 就 是 受 限制 的 goto 语 句 ， 通 常 被 用 于 退出 switch 结 构 。 下 面 的 switeh 
构造 使 用 了 break 语 句 来 限制 在 每 一 次 执行 中 仅 执 行 单个 可 选择 段 . 

Switch (index) { 

case 1: 
case 3: odd += 1; 
sumodd += index; 
break; 
case 2: 
case 4: even += 1; 
sumeven += index; 
break; 
default: printf("Error in Switch, index = d\n", index); 


} 


偶然 允许 控制 流程 经 过 一 个 可 选择 代码 段 到 达 另 一 个 可 选择 代码 段 ， 是 较为 方便 的 。 这 显 
然 球 是 为 什么 在 switch 构 造 中 不 存在 隐 式 分 支 的 缘由 。 当 遗 漏 一 个 选择 段 中 的 break 语 句 ， 
从 而 导致 控制 不 正确 地 流 到 下 一 段 时 ， 这 种 设计 就 会 出 现 可 靠 性 问题 。 C 的 switch 语 句 的 设计 
人 员 选 择 降 低 某 种 程度 的 可 靠 性 以 换取 灵活 性 。 然 而 研究 表明 ， 人 们 极 少 使 用 将 控制 流程 从 一 
个 可 选择 段 过 渡 到 另 一 个 可 选择 段 的 这 种 功能 。C 语 言 中 的 switch 语 句 基于 的 是 ALGOL 68 中 
的 多 向 选择 语句 ， 但 后 者 并 没有 可 选择 段 的 隐 式 分 支 。 C# 中 的 switch 语 句 与 其 他 基于 C 的 语 
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言 中 的 switch 语 句 不同 ， 它 的 静态 语义 规则 不 允许 隐 式 地 执行 多 个 可 选择 段 。 按 照 这 条 规则 ， 
每 一 个 可 选择 段 都 必须 结束 于 一 个 显 式 的 无 条 件 分 支 语句 ， 或 者 是 一 条 break 语 句 ， 它 将 控制 
转移 出 switch 构 造 ， 或 者 是 一 条 goto 语 句 ， 它 将 控制 转移 到 一 个 可 选择 段 (或 者 任意 位 置 )。 


例如 
switch (数值 ) { 
case -1: 
负数 ++; 
break; 
case 0: 
零 值 ++; 
goto case 1; 
case 1: 
IER ++; 
default: 
Console.WriteLine("Error in switch \n"); 


Uo 
Nn 
N 


} 


请 注意 ，Console .WriteLine 是 C#i 语 言 中 用 来 显示 字符 串 的 方法 。 

Ada 中 的 case 语 句 是 出 现 于 1966 年 的 ALGOL W 语 言 中 的 多 向 选择 器 语句 的 后 裔 。 这 种 结 
构 的 一 般 形 式 为 

case 表 达 式 is 


when 选择 列表 => 语句 序列 ; 


when 选择 列表 => 语句 序列 ; 
[when others => 语句 序列 ; ] 

end case; 

这 里 的 表达 式 是 序数 类 型 的 〈 即 整数 、 布 尔 、 字 符 或 枚 举 类 型 ) ， 而 when others 子 句 是 
可 选择 的 。 

Ada 中 的 case 语 句 选择 列表 通常 是 单个 的 字面 常量 ,但 它们 也 可 以 是 子 范围 ， 如 10 .. 15, 
它们 还 可 以 使 用 由 符号 “I!” 分 开 的 OR 操作 符 。 例 如 ， 下 面 的 形式 也 可 以 作为 选择 列表 出 现 : 
10115120, when others 子 句 被 用 于 未 表示 的 值 。Ada 要 求 选择 列表 被 穷 举 ， 这 个 要 求 稍 微 
提高 了 可 靠 性 ， 因 为 它 不 允许 不 经 意 地 忽略 一 个 或 者 多 个 选择 值 。 大 多 数 的 Ada 中 的 case 语 句 
都 包括 了 when others 子 句 ， 用 以 保证 选择 列表 是 穷 举 的 。 因 为 要 求 选择 列表 必须 是 穷 举 的 ， 
因而 从 来 就 不 会 存在 应 该 如 何 处 理 控制 表达 式 具 有 未 被 表示 的 值 的 问题 。 

在 选择 列表 中 的 值 必须 是 互 斥 的 ， 这 就 是 说 ， 一 个 常量 不 能 够 出 现在 多 个 选择 列表 之 中 。 
为 外 ， 字 面 常 量 (也 可 以 是 命名 常量 ) 必须 具有 与 表达 式 相同 的 类 型 。 

Ada 语 言 的 case 语 句 的 语义 如 下 所 述 : 首先 对 表达 式 求 值 ， 然 后 将 所 求 出 的 值 与 选择 列表 
中 的 字面 常量 进行 比较 。 如 果 找 到 了 匹配 ， 就 将 控制 转移 到 与 匹配 的 常量 相关 联 的 语句 。 当 完 
成 了 语句 的 执行 时 ， 又 将 控制 转移 到 case 构 造 之 后 的 第 一 条 语句 。 因 此 ，Ada 语 言 中 的 case 语 
句 就 比 基 于 C 的 语言 中 的 switch 语 句 更 可 靠 ， 因 为 这 些 switch 语 句 在 可 选择 程序 段 之 后 没有 
隐 式 的 出 口 。 

PHP 中 的 switch 语 句 使 用 了 C 的 switch 语 句 的 语法 ,但 却 具 有 不 同 的 语义 。 其 中 的 case 
的 值 可 以 为 PHP 语 言 中 的 任何 数量 类 型 一 一 字符 串 、 整 数 或 者 双 精 度 值 。 在 C 中 ， 如 果 在 选择 段 [35 
的 尾部 没有 break， 那 程序 将 进入 下 一 段 继续 执行 。 

Ruby 有 两 种 形式 的 多 向 选择 结构 ， 两 种 结构 都 称 为 case 表 达 式 ， 也 都 产生 最 后 表达 式 求 
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值 的 值 。 有 一 种 Ruby 的 case 表 达 式 在 语义 上 是 与 嵌 套 if 语句 的 列表 是 相似 的 : 


case 
when 布尔 _ 表 达 式 then 表达 式 


sta 布尔 _ 表 达 式 then 表达 式 

[else 表达 式 ] 

end 

这 个 case 表 达 式 的 语义 是 自 顶 向 下 地 一 次 求 值 一 个 布尔 表达 式 。case 表 达 式 的 值 是 布尔 
表达 式 为 真 的 第 一 个 表达 式 的 值 。 在 这 个 结构 中 ，e1lse 表 示 真 ，else 子 句 是 可 选 的 。 例 
大， 


leap = case 
when year % 40 
when year % 10 
else year % 4 
end 


如 采 yeaz 是 半年 ，case 表 达 式 求 值 为 真 。 
其 他 的 case 表 达 式 形式 (更 像 switch) 如 下 : 
case 表达 式 
when 值 then 
-语句 顺序 
when 值 then 
- 语句 顺序 
[else 
-语句 顺序 ] 
end 
case 值 与 case 表 达 式 比较 ,一 次 一 个 、 自 顶 向 下 ， 直 到 找到 一 个 匹配 项 。 通 过 使 用 为 所 
有 内 建 类 中 定义 的 === 关 系 操作 符 来 作 比 较 。 如 果 case 是 一 个 范围 ， 如 (1...100)，=== 定 义 为 
内 部 测试 ，case 表 达 式 的 值 在 给 定 范围 时 为 真 。 如 果 case 值 是 类 名 ，case 值 是 一 个 case 表 
达 式 类 的 对 象 或 其 子 类 的 一 个 对 象 ，=== 定 义 为 产生 真 。 如 果 case 值 是 正则 表达 式 ，=== 定 义 
为 简单 的 模式 匹配 。 
考虑 下 面 例子 : 
century = case year 
when (1700..1799) then "Eighteenth" 
when (1800..1899) then "Nineteenth" 
when (1900..1999) then "Twentieth" 
else "other" 
end 
Perl 和 Python 都 没有 多 向 选择 结构 。 
8.2.2.3 使 用 if 的 多 向 选择 
在 许多 情况 下 ，switch 或 case 构 造 (Ruby 的 case 例 外 ) 并 不 适合 于 多 向 选择 。 例 如 ， 
当选 择 必须 基于 布尔 表达 式 ， 而 不 是 基于 一 些 序数 类 型 时 ， 就 能 够 使 用 岁 套 双向 选择 器 来 模拟 


0 then true 
0 then false 


I Oo 
io Wl 


日 “该 例 来 自 于 Thomas et. al (2005), 
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别 为 这 种 用 法 实施 了 扩展 。 在 这 些 扩展 中 允许 丢弃 掉 一 些 特殊 字 。 具 体 而 言 ， 如 使 用 单个 特殊 
字 来 代替 else-if 词 组 ， 并 且 抛 弃 了 嵌 套 的 if 语 句 上 的 特殊 终结 字 。 然 后 将 嵌 套 的 选择 器 称 为 
elsif 子 句 。 考 虑 下 面 的 Python 选择 器 构造 (注意 ， 在 Python 中 逻辑 else if 拼 写 为 elif) : 


££ count < 10 ¢ 
bagl = True 

elif count < 100 
bag2 = True 

elif count < 1000 : 
bag3 = True 


它 与 下 面 的 结构 等 价 : 


if count < 10: , 
bagl = True f 
else : | 
if count < 100 : 
bag2 = True 
else : 
if count < 1000 : 
bag3 = True 
else : 
bag4 = True 


else-if 版 本 是 这 两 种 形式 中 可 读 性 较 好 的 一 种 。 注 意 ， 这 个 例子 不 容易 用 switch 语 名 
来 模拟 ， 因 为 其 中 每 一 条 可 选择 语句 中 的 选择 都 是 以 布尔 表达 式 为 基础 的 。 因 此 ，else-if 构 ”B59] 
造 不 是 switch 的 重复 形式 。 事 实 上， 在 当代 语言 中 没有 一 种 多 向 选择 器 比 if-then-elsif 更 
为 一 般 化 。 下 面 给 出 一 个 具有 else-if 子 句 的 一 般 选 择 器 语句 的 操作 语义 描述 ， 其 中 的 BE 代表 
逻辑 表达 式 ， 而 S 则 代表 语句 ， 
if El goto 1 
if E2 goto 2 
1: S1 | 
goto out 


2: $2 
goto out 


out: ... 

从 这 种 描述 中 ， 我 们 可 以 看 到 多 向 选择 结构 与 el1se-if 构 造 之 间 的 不 同 : 在 一 种 多 选择 构 
造 中 ， 所 有 的 E 都 限制 在 将 单个 表达 式 的 值 与 其 他 一 些 值 的 一 些 比较 中 。 

没有 包括 else-if 构 造 的 语言 也 可 以 使 用 同样 的 控制 结构 ， 只 是 键入 量 稍微 多 一 些 。 

上 面 Python 例 子 的 1f-then-else-if 构 造 能 写成 下 面 Ruby 的 case 语 句 ， 

when count < 10 then bagl = True 

when count < 100 then bag2 = True 


when count < 1000 then bag3 = True 


end 


else-if 构 造 基 于 的 是 条 件 表达 式 的 常用 数学 构造 。 我 们 将 在 第 15 章 讨论 的 函数 式 程序 设 
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计 语 言 将 经 常 使 用 条 件 表 达 式 作为 语言 的 基本 控制 构造 之 一 。 
8.3 循环 语句 


循环 语句 是 导致 一 条 语句 或 一 组 语句 被 执行 零 次 、 一 次 或 多 次 的 一 种 语句 。Plankalkiil 以 后 
的 每 一 种 程序 设计 语言 都 包括 了 某 些 重复 代码 段 的 执行 方法 。 循 环 是 计算 机 的 基本 功能 。 如 果 
不 能 循环 的 话 ， 就 会 需要 程序 人 员 说 明 程序 序列 中 每 一 个 动作 ， 可 用 的 程序 将 会 极为 庞大 和 不 
灵活 ， 并 且 将 耗费 大 量 的 时 间 来 编写 ， 需 要 大 量 的 存储 空间 来 存储 程序 。 

语句 的 重复 执行 ， 在 一 种 函数 式 语言 中 通常 是 由 递归 而 不 是 循环 构造 来 完成 的 。 关 于 函数 
式 语言 中 的 递归 ， 将 在 第 15 章 中 讨论 。 

程序 设计 语言 中 的 第 一 种 循环 构造 与 数组 直接 关联 。 它 起 源 于 这 样 一 种 事实 ， 在 计算 机 时 
代 的 最 早期 ， 绝 大 多 数 的 计算 都 是 数值 性 的 ， 并 经 常 使 用 循环 来 处 理 数组 中 的 数据 。 

人 们 已 经 开发 了 几 种 类 型 的 循环 控制 语句 。 这 种 分 类 是 基于 设计 人 员 怎 样 来 回答 下 面 两 个 
基本 设计 问题 而 定义 的 ; 

+ 怎样 来 控制 循环 ? 

+ 循环 的 控制 机 制 应 该 出 现在 什么 位 置 ? 

用 于 循环 控制 的 主要 可 能 类 型 有 逻辑 、 计 数 或 者 两 者 的 结合 。 对 于 控制 机 制 位 置 的 主要 先 
择 ， 有 在 循环 的 顶部 ， 或 者 在 循环 的 底部 。 这 里 的 所 谓 顶部 与 底部 是 逻辑 上 的 标志 ， 而 非 物理 
上 的 标志 。 问 题 的 实质 不 是 控制 机 制 的 物理 位 置 ， 而 是 这 个 机 制 究竟 是 在 循环 体 的 执行 之 前 还 
是 之 后 执行 并 影响 控制 。 我 们 将 在 第 8.3.3 节 讨论 第 三 种 选择 ， 即 能 够 允许 用 户 决定 应 该 将 控制 
机 制 放置 在 什么 位 置 上 。 

循环 结构 的 体 是 循环 语句 控制 执行 的 语句 系列 。 我 们 使 用 术语 先 测试 来 指 循环 完成 的 测试 
发 生 在 循环 体 执行 之 前 ， 而 术语 后 测试 指 这 种 测试 发 生 于 循环 体 执行 之 后 。 循 环 语句 加 上 相关 
的 循环 体 就 构成 循环 构造 。 

除了 基本 的 循环 语 名 以外， 我们 还 讨论 另 一 种 形式 ， 它 自 成 一 类 : 即 ， 用 户 定义 的 循环 控制 。 


8.3.1 计数 器 控制 的 循环 


计数 循环 控制 语句 具有 一 种 维持 计数 数值 的 变量 ， 称 为 循环 变量 。 这 种 语句 也 包括 了 一 些 
方式 来 说 明 循环 变量 的 初 值 与 终 值 ， 以 及 步 长 ， 步 长 是 相 邻 的 两 个 循环 变量 值 之 差 。 循 环 的 说 
明 包 括 初 值 、 终 值 以 及 步 长 ， 这 些 被 统称 为 循环 参数 。 

尽管 好 辑 控制 的 循环 比 计 数控 制 的 循环 更 为 一 般 ， 但 罗 辑 控制 的 循环 并 不 是 必然 比 计 数控 
制 的 循环 应 用 更 普遍 。 因 为 计数 控制 的 循环 较为 复杂 ， 所 以 它们 的 设计 要 求 就 更 高 。 

计数 控制 的 循环 通常 由 机 器 指令 支持 。 然 而 不 幸 的 是 ， 机 器 的 体系 结构 常常 比 设计 这 个 结 
构 时 所 流行 的 程序 设计 方法 寿命 更 长 。 例 如 ，VAX 计算 机 有 一 条 非常 便于 后 测试 的 计数 控制 循 
环 实现 的 指令 ， 这 条 指令 是 在 VAX 的 设计 之 时 (20 世纪 70 年 代 的 中 期 ) Fortran 语 言 所 具有 的 ，。 
但 是 在 VAX 计 算 机 被 广泛 使 用 时 ，Fortran 已 经 不 再 具有 这 种 计数 控制 循环 。 

当然 ， 语 言 构造 比 机 器 的 体系 结构 寿命 更 长 ， 却 也 是 有 的 事实 。 例 如 ， 本 书 作 者 就 知道 ， 
当代 机 如 已 经 不 再 具有 实现 Fortran 算 术 If 语 句 的 三 向 分 支 指令 ， 虽 然 这 条 语句 最 初 包括 进 
Fortran 语 言 是 因为 在 半 个 世纪 以 前 ，IBM 704 机 器 曾经 具有 三 向 分 支 的 指令 。 

8.3.1.1 设计 问题 

循环 的 计数 控制 语句 存在 许多 设计 问题 。 循 环 变量 以 及 循环 参数 的 性 质 引起 了 大 量 的 设计 
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问题 。 循 环 变量 的 类 型 与 循环 参数 的 类 型 显然 应 该 是 相同 的 ， 或 者 至 少 应 该 是 兼容 的 ， 然 而 究 
竟 应 该 允许 什么 样 的 类 型 呢 ? 一 种 明显 的 选择 就 是 整数 ， 但 是 枚 举 、 字 符 以 及 浮 点 类 型 如 何 
E? 另 一 个 问题 是 ， 就 作用 域 而 言 ， 循 环 变量 是 否 是 一 种 普通 变量 ， 或 者 它 是 否 应 该 具有 某 种 
特殊 的 作用 域 。 与 作用 域 问题 相关 的 是 在 循环 终止 以 后 循环 变量 的 值 的 问题 。 人 允许 用 户 在 循环 
中 改变 循环 变量 或 循环 参数 会 导致 代码 难以 理解 ， 因 而 ， 另 一 个 问题 则 是 ， 这 种 改变 是 否 值 得 ， 
因为 它 虽 然 可 能 增加 一 些 灵 活性 ， 但 也 因此 增加 了 复杂 性 。 一 种 类 似 的 问题 是 对 循环 参数 求 值 
的 次 数 及 这 种 参数 求 值 所 需 特定 的 时 间 : 如 果 只 是 对 这 些 参数 求 值 一 次 的 话 ， 这 将 导致 简单 而 
不 灵 话 的 循环 结构 。 

下 面 是 对 这 些 设计 问题 的 一 个 总 结 : 

。 循 环 变量 的 类 型 和 作用 域 是 什么 ? 

© 循环 变量 在 循环 终止 时 具有 什么 样 的 值 ? 

“循环 变量 或 者 循环 参数 在 循环 中 被 改变 应 该 是 合法 的 吗 ? 如 果 是 ， 这 种 改变 会 影响 循环 

控制 吗 ? 

* 循环 参数 应 该 只 能 够 被 求 值 一 次 ， 还 是 应 该 在 循环 每 一 次 重复 时 都 被 求 值 一 次 ? 

8.3.1.2 Fortran 95 的 Do 语句 

Fortran 95 具 有 两 种 不 同 的 计数 循环 语句 ， 这 两 种 语句 
都 使 用 了 关键 字 Do。 其 中 的 一 种 语句 的 一 般 形式 为 ; ATT eT 

poms ER = ME, Al. Pk] 循环 控制 语句 , ~ Fortran II, 

这 里 的 标号 为 循环 体 中 最 后 一 条 语句 的 标号 。 如 果 没 Fortran IV 以 及 Fortran 66 中 ， 也 , 
有 说 明 步 长 ， 取 它 的 默认 值 1。 这 里 的 循环 变量 必须 为 同样 地 保留 了 这 种 语 身 ， 这 种 语 
Integer 类 型 ,循环 参数 允许 为 表达 式 ， 并 且 可 以 具有 正 名 的 显著 特性 为 它 是 后 测试 的 ， 
或 负 的 值 。 循 环 参数 在 Do 语句 开始 执行 时 被 求 值 ， 而 将 这 这 使 得 它 有 别 于 程序 设计 语言 
个 值 用 来 计算 循环 计数 ， 这 个 计数 然后 将 达到 循环 要 求 执 的 所 有 其 他 计数 循环 语 向。( 实 
行 的 次 数 。 是 循环 计数 控制 着 循环 ， 而 不 是 循环 参数 。 即 际 上 在 Fortran 66 的 说 明 中 ， 并 没 
使 可 以 在 循环 中 将 循环 参数 合法 地 改变 ， 这 些 改变 也 不 会 ”有 指出 它 的 Do 语 向 必须 是 后 测试 
影响 到 循环 控制 。 循 环 计数 是 不 允许 用 户 代码 存 取 的 一 种 “的 。 但 在 大 多 数 的 Fortran 66 实 现 
内 部 变量 。 中 ， 确 实 是 将 它 实 现 为 后 测试 的 

只 有 通过 Do 语句 才能 够 进入 Do 结构 ， 因 而 这 种 语 旬 为 形式。) 
单 入 口 的 结构 。 一 旦 Do 语句 终止 ,而 不 论 它 是 怎样 终止 的 ， 循 环 变量 都 具有 了 最 后 被 赋予 的 值 。 
因而 循环 变量 的 用 途 独 立 于 引起 循环 终止 的 方法 。 考 虑 构造 


Do 10 Index = 1, 10 
10 Continue 
在 循环 正常 终止 后 ，Index 的 值 为 11。 
下 面 给 出 一 种 关于 Fortran 95 的 Do 语句 的 操作 语义 描述 ， 9 
初 值 = 初 值 _ 表 达 式 
终 值 = 终 值 _ 表达 式 


步 长 值 = 步 长 表达 式 
do 变量 = 初 值 


O 注意 ， 如 果 init_value 为 0，terminal-value 为 实现 的 最 大 合法 整数 值 ， 该 描述 失效 ， 因 为 这 些 值 在 计算 iteration_- 
count 时 会 引起 整数 溢出 。 
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循环 _ 计 数 = 
max ( int ( ( 终 值 - WE + 步 长 值 )/ 步 长 值 )，0 ) 
loop: 
if #A%_it®& < 0 goto out 


[ 循环 体 ] 

do 变量 = do 变量 + 步 长 值 
循环 计数 = 循环 计数 - 1 
goto loop 
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Fortran 95 还 包括 了 Do 语句 的 第 二 种 形式 : 
[名 称 :] Do 变量 = 初 值 ， 终 值 [, 步 长 ] 


End Do [名 称 ] 

这 种 Do 语句 使 用 一 个 特别 的 结束 特殊 字 (或 短语 ) End Do 替代 了 一 条 标号 语句 。 下 面 是 
一 个 第 二 种 形式 的 Do 结构 框架 的 例子 ， 

Do Count = 1, 10 

eit ne 

8.3.1.3 Ada 的 for 语 名 

Ada 的 for 语 句 具 有 以 下 的 形式 : 


for 变量 in [reverse] 离散 范围 loop 


end loop; 


离散 范围 是 整数 类 型 或 枚 举 类 型 的 子 范 围 ， 如 1…10 或 者 Monday…Friday。 当 保留 字 
reverse 出 现时 ， 就 表示 将 离散 范围 内 的 值 以 相反 的 次 序 赋 给 循环 变量 。 请 注意 ， Ada 的 for 语 
句 比 Fortran 的 Do 语句 简单 ， 因 为 Ada 中 for 语 句 的 步 长 总 是 1 (或 者 是 离散 范围 中 的 下 一 个 元 素 )。 

AdaHJfor 语 句 中 最 有 意义 的 新 特性 是 循环 变量 的 作用 域 ， 也 就 是 循环 的 范围 。 变 量 在 for 
语句 中 被 隐 式 地 声明 ， 并 在 循环 终止 之 后 被 隐 式 地 解除 声明 。 例 如 ， 在 下 面 的 代码 中 


Count : Float := 1.35; 
for Count in 1..10 loop 
Sum := Sum + Count; 

end loop; 


Float 类 型 的 变量 Count 不 受 for 循 环 的 影响 。 直 到 循环 终止 之 前 ， 变量 Count 仍 然 是 
Float 类 型 的 ， 并 且 具 有 数值 1.35。 另 外 ， 该 Float 类 型 的 变量 count 在 循环 中 被 循环 计数 变 
量 Count 所 遮掩 ， 后 者 被 隐 式 地 声明 为 离散 范围 的 类 型 ， 即 Integer， 

不 能 够 在 循环 体 中 对 Ada 循 环 变量 赋值 ， 但 可 以 在 循环 体 中 改变 用 来 说 明 离散 范围 的 变量 ， 
但 因为 对 这 种 范围 仅 求 值 一 次 ， 因 而 这 种 改变 不 会 影响 循环 控制 。 将 Ada 的 for 循 环 体 分 支 是 不 
合法 的 。 下 面 是 Ada 的 for 循 环 的 一 种 操作 语义 描述 ， 

[ 定义 for_ 变量 ( 它 的 类 型 属于 离散 范围 ) ] 
[ 计算 离散 范围 ] 
loop: 
if [在 离散 范围 内 没有 剩余 的 元 素 ] goto out 
for 变量 = [| 离散 范围 中 的 下 一 个 元 素 ] 


[ 循环 体 ] 
goto loop 
out: 
[解除 for _ 变量 的 定义 ] 
因为 循环 变量 的 作用 域 就 是 循环 体 ， 在 循环 结束 之 后 循环 变量 将 无 定义 ， 因 而 在 那 时 ， 这 
些 变量 的 值 就 已 经 无 关 了 。 
8.3.1.4 基于 C 的 语言 的 for 语 名 
C 的 for 语 句 的 一 般 形 式 为 
for (表达 式 _1; 表达 式 _2; 表达 式 _3 ) 
循环 体 
在 这 里 ， 循 环 体 可 以 是 单个 语句 、 复 合 语句 或 者 null 语 句 。 
因为 这 些 语句 是 在 C 中 产生 结果 ， 因 此 可 以 认为 是 表达 式 。 而 在 for 语 句 中 的 表达 式 常 常 是 
一 些 语句 。 第 一 个 表达 式 用 于 设 定 初 值 ， 并 只 被 计算 一 次 ， 第 二 个 表达 式 是 循环 控制 ， 并 且 在 
每 一 次 执行 循环 体 之 前 被 进行 计算 。 正 如 通常 在 C 中 的 情形 一 样 ， 零 值 意 味 着 假 ， 所 有 的 非 零 
值 意 味 着 真 。 因 此 ， 如 果 第 二 个 表达 式 的 值 为 零 ， 则 会 终止 for 语 句 ; 否则 执行 循环 语句 。 在 
C99 中 ， 这 些 表达 式 还 可 以 是 布尔 类 型 。C99 中 的 布尔 类 型 仅仅 储存 0 和 1。 在 for 语 句 中 的 最 后 
一 个 表达 式 于 每 一 次 执行 循环 体 之 后 被 执行 。 它 常常 用 来 给 循环 计数 器 增值 。C 的 for 语 句 的 操 
作 语 义 描述 如 下 。 因 为 这 些 C 的 表达 式 同 时 也 是 语句 ， 我 们 在 此 处 表示 表达 式 的 求 值 就 如 同 表 
示 语 句 一 样 。 
表达 式 _1 
loop: 
if 表达 式 2 = 0 goto out 
[ 循环 体 ] 
表达 式 _3 
goto loop 
out: 


下 面 是 一 个 C 的 for 结 构 框 架 : 


for (count = 1; count <= 10; count++) 


} 

C 的 for 语 句 中 所 有 表达 式 都 是 可 选 的 。 如 果 缺 少 第 二 个 表达 式 ， 则 认为 该 表达 式 为 真 ， 因 
此 一 条 没有 第 二 个 表达 式 的 for 语 句 可 能 是 一 个 无 穷 循 环 。 如 果 是 缺少 第 一 或 者 第 三 个 表达 式 ， 
就 没有 任何 假设 。 例 如 ， 如 果 缺 少 了 第 一 个 表达 式 ， 这 仅仅 意味 着 没有 设 定 初 值 。 

注意 ，C 中 的 foz 语 句 不 需要 进行 计数 。 下 一 小 节 中 将 给 出 演示 ， 可 以 很 容易 地 模拟 计数 以 
及 逻辑 循环 结构 。 

C 的 for 语 句 的 设计 选择 如 下 : 没有 显 式 的 循环 变量 或 者 循环 参数 。 可 以 在 循环 体 中 改变 所 
有 的 相关 变量 。 可 以 按照 上 面 陈述 的 顺序 来 计算 表达 式 。 分 支 进入 C 的 for 循 环 体 是 合法 的 ， 虽 
然 这 会 引起 很 大 的 混乱 。 

C 中 的 for 语 句 比 Fortran 和 Ada 中 的 计数 循环 语句 更 灵活 ， 因 为 它 的 每 一 个 表达 式 都 可 以 包 
舍 多 条 语句 ， 这 就 允许 了 多 种 任意 类 型 的 循环 变量 。 当 for 语 名 的 单个 表达 式 中 包括 了 多 条 语 
句 时 ， 使 用 喜 号 将 这 些 语 句 分开。C 中 的 所 有 语句 都 具有 值 ， 这 种 形式 的 多 条 语句 也 不 例外 。 
这 个 多 条 语句 的 值 就 是 其 中 最 后 一 条 语句 的 值 。 

考虑 下 面 的 for 语 句 : 


for (countl = 0, count2 = le 0s 


242 Pos 


countl <= 10 && count2 <= 100.0; 
sum = ++countl + count2, count2 *= 2.5); 


这 条 语句 的 操作 语义 摘 述 为 : 
countl = 0 
count2 = 1.0 

loop: 


if conuntl > 10 goto out 

if conunt2 > 100.0 goto out 
countl = counti + 1 

sum = countl +count2 

count2 = count2*2.5 

goto loop 

OUTS asa 


上 面 例子 中 的 C 的 for 语 句 不 需要 并 且 也 不 存在 一 个 循环 体 。 所 需要 的 行动 恰巧 是 for 语 句 
目 身 的 一 部 分 ， 而 不 是 在 它 的 循环 体 中 。 其 中 的 第 一 个 和 第 三 个 表达 式 为 多 条 语句 。 在 这 两 个 
表达 式 中 ， 对 整个 表达 式 都 进行 计算 ,但 是 所 产生 的 值 没 有 被 用 于 循环 控制 。 

在 两 个 方面 上 ，C99 和 C++ 中 的 for 语 句 不 同 于 早期 C 版 本 中 的 for 语 句 。 首 先 ， 除 了 可 以 
使 用 算术 表达 式 之 外 ，C99 和 C++ 中 的 for 语 句 还 可 以 将 布尔 表达 式 用 于 循环 控制 。 其 次 ， 在 这 
些 for 语 句 的 第 一 个 表达 式 中 ， 还 可 以 包含 变量 的 定义 。 例 如 ， 

for (int count = 0; count < len; COUNTTT) { se } 

在 for 语 句 中 所 定义 的 变量 作用 域 是 ， 从 变量 定义 开始 ， 一 直到 循环 体 的 结尾 。 

Java 和 C# 的 for 语 句 与 Ct+ 的 for 语 句 类 似 ， 但 它 的 循环 控制 表达 式 被 仅 限制 为 boolean 类 型 。 

在 所 有 基于 C 的 语言 中 ， 每 一 次 的 循环 都 将 对 循环 参数 进行 求 值 。 另 外 ， 还 可 以 在 循环 体 
中 改变 循环 参数 表达 式 中 的 变量 。 因 而 ， 这 些 基 于 C 的 语言 中 的 循环 要 复杂 得 多 ， 并 且 较 之 
Fortran 和 Ada 中 的 计数 循环 ， 可 靠 性 程度 也 较 低 。 

8.3.1.5 Python 的 for 语 名 

Python 的 Eorz 的 一 般 形 式 

for 循环 _ 变 量 in 对 象 : 

-循环 体 

else: 


-else f% 
人 循环 变量 用 有 一 个 范围 的 对 象 中 的 值 来 赋值 。 当 循环 正常 终止 时 ， 就 执行 else 子 句 。 
考虑 下 面 的 例子 : 


for count in [2, 4, 6]: 
print count 


产生 

2 

4 

6 

Python 中 大 多 数 简单 的 计数 循环 都 使 用 range 函 数 。range 接 收 1 个 、2 个 或 3 个 参数 。 下 面 
例子 说 明了 range 的 动作 : 


range(5) returns [0, 1, 2, 3, 4] 
range(2, 7) returns [2, 3, 4, Sy 6] 
range(0, 8, 2) returns [0, 2, 4, 6] 


TE 6) BR KILER 25 H 243 


注意 ，range 在 给 定 的 参数 范围 内 从 来 不 返回 最 高 值 。 例 如 ， 


for count in range(5, 11, aye 
print count 


产生 


5 
7 
9 


8.3.2 逻辑 控制 的 循环 


在 许多 情况 下 ， 需 要 重复 地 执行 语句 系列 ， 但 这 种 重复 的 控制 是 基于 布尔 表达 式 的 ， 而 不 
是 基于 计数 器 的 。 在 这 些 情形 中 ， 使 用 逻辑 控制 循环 十 分 方便 。 事 实 上 ， 逻 辑 控制 的 循环 比 计 


外 前 面 曾经 讨论 过 ， 只 有 选择 结构 和 风 辑 循环 才 是 表达 任何 流程 图 控制 结构 的 关键 。 
8.3.2.1 设计 问题 
因为 逻辑 控制 的 循环 远 比 计数 控制 的 循环 简单 ， 所 以 它 只 具有 少数 的 设计 问题 ， 
“控制 应 该 是 先 测试 还 是 后 测试 的 ? 
* 逻辑 控制 的 循环 仅仅 是 计数 循环 的 特殊 形式 ， 还 是 一 种 完全 不 同 的 语句 ? 
8.3.2.2 示例 
基于 C 的 语言 包括 了 先 测试 和 后 测试 这 两 种 逻辑 控制 循环 。 这 些 逻 辑 控 制 循环 并 不 是 这 些 
语言 中 的 计数 控制 循环 语句 的 特殊 形式 。 先 测试 和 后 测试 逻辑 控制 的 循环 具有 下 面 的 形式 ; 
while (控制 _ 表 达 式 ) 
循环 体 
以 及 
do 
循环 体 
while (控制 _ 表 达 式 ) 
这 两 种 语句 形式 都 可 以 通过 下 面 的 C++ 代 码 段 来 说 明 . 
ee 4 EON ee ee ee 
while (indat >= 0) { 
sum += indat; 


indat = Int32.Parse(Console.ReadLine() ); 
} 


value = Int32.Parse(Console.ReadLine() ); 
do { 
value /= 10; 
digits ++; 
} while (value > 0); 
注意 ， 这 些 例 子 中 的 所 有 变量 都 是 整数 类 型 。Console 对 象 的 ReadLine 方 法 是 从 键盘 输 
入 一 行文 本 。Int32 .Parse 是 从 它 的 字符 串 参 数 中 查找 出 数字 ， 并 将 数字 转换 成 int 类 型 ， 然 
后 返回 。 
在 先 测试 版 本 〈 以 while 开 始 的 版 本 ) 中 ， 只 要 表达 式 的 计算 结果 为 真 ， 就 执行 语句 。 在 


U 
ON 
U 


Ww 
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C、C++ 以 及 Java 中 的 后 测试 版 本 (以 do 开始 的 版 本 ) 中 ， 在 表达 式 的 计算 结果 为 假 之 前 ， 都 将 
执行 循环 体 。do 与 while 语 句 之 间 的 唯一 真正 不 同 , 是 do 语句 总 是 使 得 循环 体 至 少 被 执行 一 次 。 
在 这 两 种 情形 中 ， 它 们 的 语句 都 可 以 是 复合 的 。 下 面 给 出 这 两 种 语句 的 操作 语义 描述 : 
while 
loop: 
if 控 制 表达 式 为 假 goto out 
[循环 体 ] 
goto loop 
out: ... 


do-while 


loop: 
[循环 体 ] 
if 控 制 _ 表 达 式 ”为 真 goto loop 

在 C 和 C++ 语 言 中 分 支 进入 while 和 do 循环 体 都 是 合法 的 。C89 版 本 使 用 一 种 算术 表达 式 来 
实施 控制 ， 而 在 C99 以 及 C++ 中 ， 控 制 表 达 式 可 以 是 算术 的 ， 也 可 以 是 布尔 代数 的 。 

Java 中 的 while 和 do 语句 与 C 和 C++ 中 的 类 似 ， 只 是 Java 中 的 控制 表达 式 必 须 为 poolean 类 
型 ， 而 且 因 为 Java 中 没有 goto 语 句 ， 所 以 进入 这 两 种 循环 体 都 只 能 通过 循环 体 的 开头 ， 而 不 能 
通过 其 他 任何 位 置 。 

Fortran 95 既 没有 人 先 测 试 逻 辑 人 循环 ， 也 没有 后 测试 逻辑 循环 。Ada 具 有 一 种 先 测 试 迎 辑 人 循环 ， 
但 是 设 有 逻辑 循环 的 后 测试 版 本 。 

Perl 和 Ruby 具 有 两 种 先 测试 逮 辑 循环 : while 和 until。 这 种 until 循 环 十 分 类 似 于 
while 和 循环， 但 却 是 使 用 控制 表达 式 的 反 值 。Perl 也 有 两 种 后 测试 循环 ， 它 在 on 块 使 用 while 
和 until 作 为 语句 修改 符 。 

后 测试 循环 并 不 常用 ， 而 且 这 种 测试 还 可 能 存在 某 种 程度 的 危险 性 ， 因 为 程序 人 员 有 了 时 会 
忘记 循环 体 总 是 至 少 被 执行 一 次 。 将 后 测试 控制 放置 在 循环 体 之 后 ， 它 在 这 个 位 置 具 有 语义 上 
的 影响 ， 这 种 语法 设计 通过 使 逻辑 更 加 清晰 ， 可 以 帮助 避免 这 类 问题 。 


8.3.3 用 户 定位 的 循环 控制 机 制 


在 某 些 情形 下 ， 由 程序 人 员 来 选择 除 循环 的 顶端 或 底部 之 外 的 循环 控制 位 置 较为 方便 。 因 
而 一 些 语 言 提 供 了 这 种 功能 。 用 户 定 位 的 循环 控制 语法 机 制 可 以 是 相当 简单 的 ， 因 而 它 的 设计 
也 不 会 很 困难 。 也 许 最 需要 关注 的 问题 是 ， 是 否 可 以 退出 单 层 循环 或 者 退出 几 层 租 套 的 循环 。 
这 种 机 制 的 设计 问题 如 下 : 

。 条件 机 制 应 该 是 出 口 的 整体 部 分 吗 ? 

。 应 该 只 允许 退出 一 个 循环 体 ， 还 是 也 可 以 退出 包含 它 的 循环 ? 

C、C++、Python、Ruby 和 C# 有 具有 无 条 件 、 无 标号 的 退出 语句 (break 语句 ) ;Java、Per] 
以 及 C# 则 具有 无 条 件 、 有 标号 的 退出 语句 (Java 以 及 C# 中 的 break 语 句 ，Perl 中 的 last 语 句 )。 

下 面 是 Java 中 骨 套 循环 的 一 个 例子 ， 在 这 个 例子 中 有 从 岁 套 的 内 层 循 环 到 外 层 循 环 的 退出 。 

jpn = 0; row < numRows; rowł+) 

for (col = 0; col < numCols; col++) { 


sum += mat[row][col]; 
if (sum > 1000.0) 
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break outerLoop; 
} 

C、C++ 和 Python 包括 了 一 条 没有 标号 的 控制 语句 continue， 这 条 语句 将 控制 转移 到 最 小 
的 封闭 循环 的 控制 机 制 。 这 不 是 一 种 退出 ， 而 只 是 一 种 方式 ， 它 在 当前 的 循环 中 跳 越 其 余 的 循 
环 语句 ， 并 没有 终止 循环 结构 。 例 如 ， 考 虑 下 面 的 代码 : 

while (sum < 1000) { 

getnext (value); 
if (value < 0) continue; 


sum += value; 


} 


在 这 里 ， 负 值 使 得 后 面 的 赋值 语句 被 跳 越过 去 ， 并 将 控制 转移 到 循环 顶部 的 条 件 语句 。 另 
一 方面 ， 在 下 面 的 代码 中 ， 


while (sum < 1000) { 
getnext (value); 
if (value < 0) break; 
sum += value; 


} 

在 这 里 ， 负 值 则 终止 了 这 个 循环 。 

Java 和 Perl 都 具有 类 似 continue 的 语句 ， 但 是 它们 包括 了 语句 标号 ， 用 以 说 明 应 该 继续 的 
是 哪 一 个 循环 。 

1ast 和 break 语句 都 提供 退出 循环 的 多 个 出 口 ， 这 在 某 种 程度 上 妨碍 了 可 读 性 。 然 而 需要 
终止 循环 的 非 寻常 情况 十 分 常见 ， 这 就 支持 了 这 种 构造 。 此 外 ， 可 读 性 并 没有 受到 严重 的 危害 ， 
因为 所 有 这 种 循环 退出 的 目标 都 是 循环 (或 者 一 个 封闭 的 循环 ) 之 后 的 第 一 条 语句 ， 而 不 是 程 
序 中 的 任意 位 置 。 最 后 ， 选 择 使 用 多 个 break 来 退出 多 层 循 环 在 可 读 性 上 是 很 差 的 。 

用 户 定 位 循环 出 口 的 设计 动机 十 分 简单 : 通过 一 种 高 度 限制 的 分 支 语 句 ， 来 满足 对 goto 语 
句 的 需求 。goto 语 句 的 目标 可 以 是 程序 中 的 许多 位 置 ， 既 可 以 在 goto 语 句 的 上 方 ， 也 可 以 在 
它 的 下 方 。 然 而 ， 用 户 定位 的 循环 出 口 的 目标 必须 是 在 出 口 的 下 方 ， 并 且 只 能 紧 跟 在 复合 语句 
的 结尾 。 





第 一 部 分 : 语言 学 及 Perl 语言 的 诞生 

LARRY WALL 

Larry Wall 戴 着 许多 顶 帽 子 一 一 他 涉足 书籍 出 版 、 语 言 出 版 、 软 件 出 版 ， 以 及 儿 
MAA (他 有 四 个 孩子 )。 他 曾 在 Seattle Pacific University (西雅图 太平 洋 大 学 )， 
Berkeley (伯克利 ) 和 UCLA (加 州 大 学 洛杉矶 分 校 ) 学 习 过 。 他 还 曾经 在 Unisys 公 
CUNA T? F], Jet Propulsion Laboratories; 以 及 Seagate 公 司 工作 过 。 给 他 带 来 最 大 名 气 的 是 语 
言 出 版 〈 但 是 却 只 有 最 少 的 金钱 回报 ”Larry 补 充 道 ) : Larry 是 Perl 脚 本 语言 的 作者 。 

专业 背景 介绍 

IF): 你 从 事 过 的 最 满意 的 工作 是 什么 ? 

@: 在 JPL (Jet Propulsion Laboratories) 的 工作 很 有 意思 。 我 在 那里 又 做 系统 管理 ， 又 进行 系统 开发 。 
系统 管理 员 的 工作 特别 好 ， 因 为 在 90% 的 时 间 里 无 所 事 事 ， 只 有 10% 的 时 间 是 去 应 急 。 所 以 我 有 足够 的 时 
则 用 于 Perl 的 开发 。 
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lal: 你 最 奇怪 的 工作 是 什么 ? 

E: 这 个 问题 很 难 回答 。 我 的 大 多 数 工作 都 很 奇怪 。 让 我 想 一 想 …… 我 曾经 给 一 个 叫 “ 疯 马 ” 的 野 
营 当 过 顾问 。 我 曾经 给 “ 王 安 ” 公司 的 一 个 系统 用 BASIC 编 写 过 商用 软件 。 这 个 系统 只 能 够 通过 “菜单 ” 
来 控制 。 我 曾经 在 MusiComedy Northwest 做 过 几 年 的 首席 小 提琴 。 也 许 最 可 笑 的 一 件 事情 是 录音 。 因 为 只 
有 我 一 个 人 能 够 拉 小 提琴 ， 他 们 就 给 我 录音 八 次 或 者 是 十 次 ， 这 样 ， 我 就 像 是 整个 小 提琴 声 部 一 样 。 

Al: 你 当前 的 工作 是 什么 ? 

Z: 我 现在 的 工作 是 设计 Perl 语 言 的 第 6 个 版 本 。 不 幸 的 是 ， 目 前 谁 也 不 给 这 项 工作 付 一 分 钱 。 当 然 ， 
也 没有 人 为 前 面 的 五 个 版 本 正式 付 过 我 任何 工资 。 这 一 次 ， 如 果 有 人 哪怕 是 非 正式 地 付 我 一 点 钱 ， 那 就 好 
了 。 也 许 当 你 读 到 这 篇 访谈 时 ， 已 经 有 人 雇用 我 到 好 莱 坞 当 作家 或 者 演员 了 。 

语言 学 与 计算 机 语言 

H: 你 学 的 是 语言 学 ， 还 在 读书 时 ， 你 考虑 的 是 什么 样 的 专业 道路 ? 

E: 我 和 我 的 妻子 曾经 打算 去 非洲 作 现场 语言 学 家 ， 曾 经 有 一 段 时 间 是 打算 作 与 Wycliffe 圣 经 有 关 的 
翻译 工作 。 直 到 我 发 现 了 自己 的 食物 过 敏 症 (后 来 才 有 的 ) 才 放 弃 了 这 一 条 路 。 我 至 今 不 知道 ， 我 是 否 会 
成 为 一 个 很 好 的 现场 语言 学 家 一 一 也 许 我 待 在 现场 之 外 ， 编 写 Perl 语 言 对 语言 学 做 出 的 贡献 更 大 一 些 。 不 
容 置疑 的 是 ， 我 始终 热爱 语言 学 ， 在 过 去 的 几 年 中 ， 我 一 直 在 自学 日 语 ， 只 是 为 了 不 让 这 方面 的 神经 细胞 
僵化 或 死 掉 ， 或 者 是 自然 退化 之 类 。 

Ih]: 你 当初 对 自然 语言 的 兴趣 怎么 会 转向 了 程序 设计 语言 ? 

E: 我 应 该 承认 ， 在 我 写 出 Perl 语 言 之 前 ,我 的 语言 学 与 我 的 计算 机 科学 几乎 是 相互 不 搭界 的 。 在 计 
算 机 方面 ， 我 曾经 编写 过 几 个 编译 器 ， 从 来 也 没有 反问 过 自己 : 为 什么 大 多 数 的 计算 机 语言 看 起 来 都 是 那 
么 的 不 自然 ? 在 语言 学 方面 ， 我 曾经 使 用 LISP 编 写 过 几 个 自然 语言 的 程序 ， 但 我 一 般 从 未 考虑 过 ， 使 用 计 
算 机 来 处 理 自然 语言 。( 任 何 使 用 过 Babblefish 语 言 翻译 器 的 人 都 会 发 现 这 一 点 。) 但 我 是 直到 开始 编写 Perl 
语言 的 工作 之 后 ， 才 开始 意识 到 : 之 所 以 自然 语言 让 人 感到 自然 ， 是 因为 其 中 的 许多 原则 使 之 然 ， 那 么 ， 
我 们 可 以 将 这 中 间 的 一 些 原 则 教 给 计算 机 ， 而 并 不 会 让 计算 机 产生 烦恼 。 

Perl 语 言 的 诞生 

In]; 在 你 编写 Perl 语 言 的 那些 日 子 ， 你 在 Unisys 公 司 做 些 什么 工作 ? 

E: 我 当时 是 系统 管理 员 加 系统 程序 员 ， 为 美国 国家 保密 局 (NSA，National security Agency) 的 一 个 机 
密 项 目 工作 。 如 果 我 告诉 你 关于 这 个 项 目的 事情 ， 你 可 能 会 杀 死 我 也 不 一 定 。 那 件 事 看 来 很 精 糕 ……。 反 
正 ， 我 当时 将 自己 关 在 一 个 他 们 称 之 为 “ 铜 房 ” 的 房间 里 ， 整 天 摆弄 一 些 对 外 界 根本 就 不 存在 的 计算 机 。 

IF): 你 是 怎样 产生 了 有 关 新 语言 的 想法 的 ? 

E: 我 们 当时 试图 通过 一 个 低速 的 加 密 网 络 ， 来 进行 一 种 全 国 性 的 配置 管理 。 这 样 就 产生 了 大 量 的 
文本 数据 ， 但 其 中 有 用 的 信息 很 少 。 因 而 最 初 Perl 语 言 是 设计 用 来 对 那些 分 散 的 、 装 有 文本 的 文件 进行 检 
碍 ， 找 出 其 中 的 有 用 信息 ， 并 且 打 印 出 报告 。Perl 的 两 个 正式 的 全 名 都 反映 了 这 个 目的 ， 它 们 是 : “Practical 
Extraction and Report Language” 《实用 提炼 与 报告 语言 ) 和 “Pathologically Eclectic Rubbish Lister” (Az 
病 的 垃圾 收集 者 )。 

站 有 哪些 商业 的 需求 在 当时 还 没有 得 到 满足 ? 

B: 实质 上 ， 是 对 于 灵活 性 的 要 求 。 我 们 当时 使 用 UNIX 系 统 就 是 为 了 灵活 性 ， 然 而 UNIX 系 统 所 提 
供 的 用 于 shell 的 脚本 程序 设计 工具 却 远 非 灵 活 ， 不 能 够 像 我 们 所 希望 的 那样 ， 在 文本 文件 之 中 游 刃 。 
UNIX 的 awk 程序 设计 语言 虽然 是 迈 向 正确 方向 的 一 团 ' 但 却 并 不 符合 我 的 要 求 。 我 觉得 自己 可 以 做 得 更 
好 。UNIX 的 工具 在 它 的 适用 方面 真 的 已 经 非常 地 好 。 但 对 于 它 的 不 适用 方面 ， 几 乎 根本 就 是 无 用 的 东西 。 
问题 在 于 ……UNIX 的 toolbox 是 想 成 为 一 种 可 扩展 的 语言 ， 但 却 没 有 达到 实际 上 的 成 功 。 我 想 ， 如 果 我 能 
够 将 UNIX 中 的 好 东西 放 进 一 种 真正 的 语言 ， 这 些 东 西 都 很 灵巧 ， 你 需要 什么 就 可 以 得 到 什么 ， 那 么 人 们 
会 发 现 这 是 很 有 用 的 。 这 就 是 产生 Perl 语 言 的 原因 。 

FA): 你 首先 喜欢 的 是 哪 一 种 : 是 设计 一 种 语言 还 是 设计 一 种 程序 ? 究竟 是 哪 一 样 导致 了 另外 的 一 样 ? 

E: 我 首先 回答 第 二 个 问题 ， 我 从 来 不 认为 ， 任 何人 可 以 还 没有 使 用 过 语言 就 能 够 设计 一 种 语言 。 
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我 们 会 自然 地 自 下 而 上 地 学 习 语言 ， 开 始 会 模仿 语言 中 的 各 种 小 的 部 分 ， 只 有 到 后 来 ， 才 能 够 抽象 出 语言 
中 将 语言 凝聚 在 一 起 的 一 些 原则 。 而 计算 机 科学 家 们 喜欢 认为 他 们 可 以 自 上 而 下 地 进行 设计 ， 但 这 种 方式 
只 有 在 你 已 经 知道 你 所 寻求 的 答案 时 才 会 获得 成 功 。 一 般 而 言 ， 设 计 一 种 解决 某 些 特殊 问题 的 语言 并 不 是 
一 件 十 分 有 趣 的 事情 ， 至 少 对 我 来 说 是 这 样 的 。 

因此 ， 我 必须 首先 学 习 程序 。 我 不 认为 你 可 以 将 它 视 为 “一 见 钟情 ”， 它 更 像 是 “一 见 钟 情 加 上 一 见 
钟 恨 "。 真 正 喜 爱 程序 设计 的 人 不 会 去 设计 一 种 新 的 语言 。 他 们 没有 设计 语言 的 动力 。 只 有 当 你 发 现 你 所 
使 用 的 语言 让 你 诅 形 时 ， 你 才 会 想到 要 设计 一 种 新 的 语言 。 所 以 ， 如 果 你 想 以 计算 机 语言 设计 作为 你 的 职 
业 ， 最 好 要 准备 好 去 过 一 种 让 你 会 不 断 感 到 诅 形 的 生活 。 这 就 是 与 这 个 领域 相关 的 一 种 事实 。 如 果 你 发 现 
你 已 经 满足 于 你 的 新 语言 ， 你 就 是 一 个 妄 自尊 大 的 白痴 ， 你 也 就 不 能 成 为 一 个 好 的 语言 设计 者 。 当 然 ， 你 
也 可 以 像 我 这 样 地 妄 自 尊 大 ， 但 同时 又 适当 地 感到 些 诅 形 。 这 样 ， 你 还 是 有 些 希 望 的 。 





8.3.4 基于 数据 结构 的 循环 
需要 在 这 里 考虑 的 还 有 另 一 种 循环 结构 ， 即 依赖 于 数据 结构 的 循环 。 与 通过 计数 器 或 者 布 


尔 表达 式 来 控制 的 循环 不 同 ， 这 种 循环 是 由 数据 结构 中 元 素 的 数目 来 控制 的 。Perl， JavaScript, 


PHP, Javal 以 及 C# 都 具有 这 种 类 型 的 语句 。 

一 般 的 基于 数据 的 循环 语句 使 用 一 种 用 户 定义 的 数据 结构 和 一 种 用 户 定 义 的 函数 ， 来 遍历 
结构 中 的 所 有 元 素 。 这 种 函数 被 称 为 迭代 器 (iterator) 。 每 一 次 循环 开始 时 ADE AAR, 
并 在 每 次 调用 迭代 器 时 ， 都 按 某 种 特殊 顺序 从 特定 数据 结构 中 返回 一 个 元 素 ， 例如 ， 假 设 一 个 
程序 有 一 棵 二 又 树 ， 其 中 每 一 个 树 节点 中 的 数据 都 必须 按 某 种 特定 顺序 来 处 理 ， 针对 这 种 树 的 
一 个 用 户 定义 的 循环 语句 不 断 地 将 循环 变量 设 为 指向 树 中 的 节点 ， 一 次 循环 一 个 节点 。 最 初 执 
行 这 种 用 户 定义 的 循环 语句 时 ， 需 要 对 迭代 器 发 出 特殊 调用 ， 以 便 获 取 树 中 的 第 一 个 元 素 。 和 迭 
代 堪 必须 时 刻 记 住 它 最 后 访问 的 是 哪 一 个 节点 ， 这 样 它 就 能 够 遍 访 所 有 节点 ， 而 不 会 对 任何 一 
个 节点 进行 重复 访问 ， 所 以 迭代 器 必须 是 历史 敏感 的 。 当 和 迭代 器 不 再 能 够 找到 元 素 时 ， 用 户 定 
义 的 循环 语句 即 被 终止 。 

基于 C 的 语言 中 的 for 语 句 ， 因 为 具有 极 大 的 灵活 性 ， 所 以 可 以 使 用 它 来 模拟 用 户 定 义 的 循 
环 语句 。 再 次 假设 所 要 处 理 的 是 一 棵 二 又 树 的 节点 ， 如 来 一 个 名 为 root 的 变量 指向 二 又 树 的 根 ， 
并 且 如 果 traverse 是 一 个 函数 ， 这 个 函数 将 它 的 参数 设置 为 指向 树 中 指定 顺序 中 的 下 一 个 元 
素 ， 就 可 以 使 用 下 面 的 形式 ; 


for (ptr = root; ptr == null; ptr = traverse(ptr)) { 


} 


这 条 语句 中 的 traverse 为 迭代 器 。 

在 PHP 中 ， 使 用 一 些 预定 义 的 选 代 器 来 对 PHP 中 特有 数组 进行 迭代 访问 。 将 current 指 针 
指 疝 循环 中 上 一 次 访问 过 的 元 素 。 而 next 选 代 器 则 将 current 指 针 移 动 ， 将 它 指向 数组 中 的 
下 一 个 元 素 。Prev 和 迭代 器 再 将 current 指 针 移动 到 指向 数组 中 的 上 一 个 元 素 。 通 过 使 用 reset 
操作 符 ， 可 以 将 current 指 针 设 置 为 (或 者 重新 设置 为 ) 指向 数组 中 的 第 一 个 元 素 。 下 面 的 代 
码 将 打印 出 数字 数组 $1ist 中 的 所 有 元 素 : 

reset Slist;. 

print ("First number: " + current(Slist) + "<br />"); 

while ($current value = next($list) ) 

print ("Next number: " + S$current value + "<br \>")3 


364 
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用 户 定义 的 循环 语句 在 面向 对 象 程 序 设计 语言 中 比 在 早期 软件 开发 的 范例 中 更 为 重要 。 
原因 是 ， 现 在 的 用 户 经 常 为 数据 结构 构造 一 些 抽 象 数据 类 型 。 在 这 种 情况 下 ， 数 据 抽象 的 
作者 就 必须 提供 用 户 定义 的 循环 语句 及 其 迭代 器 ， 因 为 用 户 并 不 知道 这 种 类 型 对 象 的 表示 
Fie 

ECH, FAP MRM AIRE RARARREAAKRWAIAM, MERLE HAY 
1 at 2B 

在 Java 中 ， 一 个 由 用 户 定义 的 、 实 现 Co1lection 接 口 的 集合 中 的 元 素 可 以 通过 实现 
Itezrator 接 口 来 进行 迭代 式 访 问 。Iterator 接 口 具有 三 种 基本 的 方法 ， next, hasNext 以 
及 zemove。next 方 法 是 实际 上 的 友 代 器 。 当 被 迭代 式 访问 的 集合 中 不 再 有 元 素 时 ，next 方 法 
将 抛 出 一 个 NoSsuchElementException 异 常 。 而 hasNext 方 法 则 通常 是 在 调用 next 方 法 之 
前 被 调用 ， 如 果 在 集合 中 至 少 还 有 一 个 元 素 ， 它 将 返回 true。 

在 Java 5.0 版 本 中 加 入 了 一 条 增强 的 for 语 句 。 这 条 语句 通过 在 实现 了 Iterable 接 口 的 集 
合 中 的 对 象 的 值 或 者 数组 中 的 值 ， 从 而 简化 了 和 迭代 过 程 。 例 如 ， 如 果 我 们 有 一 个 ArrayListe 
集合 〈 名 为 myList 的 字符 串 数 组 ) 下 面 的 这 条 语句 将 对 myList 中 的 所 有 元 素 进 行 迭 代 ， 并 且 
每 一 次 都 将 一 个 元 素 放 到 myElement 中 : 


for (String myElement : myList) { ... } 


这 条 新 语句 被 称 为 “foreach” 语 句 ， 虽 然 这 条 语句 的 保留 字 仍然 是 Eor。 

C# 中 的 foreach 语 句 在 数组 以 及 其 他 集合 中 的 元 素 上 进行 迭代 。 例 如 : 

String[] strList = {"Bob", "Carol", "Ted", "Beelzebub"}; 

broach (String name in strList) 

Console.WriteLine("Name: {0}", name); 

在 上 面 的 代码 里 ， 在 Console.WriteLine 的 参数 中 标记 {0} 表 示 ， 在 将 打印 的 字符 串 中 
的 什么 位 置 上 放置 第 一 个 命名 变量 的 值 ， 即 例子 中 name 的 值 。 

Ruby 为 其 每 个 预定 义 容器 类 提供 了 迭代 器 。 因 为 它们 与 块 (实际 上 是 Ruby 的 子 程序 ) 相关 
联 ， 所 以 第 9 章 将 讨论 它们 。 


8.4 无 条 件 分 支 


无 条 件 分 支 语句 将 执行 控制 转移 到 所 说 明 的 程序 位 置 上。 在 20 世 纪 60 年 代 后 期 ,语言 设计 
中 争论 最 热烈 的 问题 是 无 条 件 分 支 是 否 应 该 成 为 任何 高 级 语言 的 组 成 部 分 ? 如 果 是 ， 又 是 否 应 
该 限制 它 的 使 用 ? 

无 条 件 分 支 ， 或 者 goto 语 句 ， 是 控制 程序 语句 执行 流程 的 最 具 功效 的 语句 。 然 而 ， 如 果 不 
小 心地 使 用 goto 语 句 ， 则 会 导致 一 些 问题 。goto 语 句 具 有 强大 的 功能 以 及 极 佳 的 灵活 性 (使 
用 goto 语 句 ， 再 加 上 一 个 选择 器 ， 便 能 够 构造 所 有 其 他 的 控制 结构 )， 但 是 这 种 非常 的 功能 也 
使 得 它 的 使 用 十 分 危险 。 如 果 没 有 在 使 用 上 施加 语言 设计 上 或 者 程序 设计 上 的 标准 来 加 以 限制 
的 话 ，goto 语 句 可 以 使 程序 无 法 阅读 ， 结 果 导 致 程序 高 度 不 可 靠 ， 并 且 极 难 维护 。 

这 兰 问 题 直接 来 自 goto 语 句 的 功能 ， 即 强迫 任何 程序 语句 跟随 执行 顺序 中 的 其 他 语句 ， 而 


O RrrayList 是 一 个 预定 义 的 集合 ， 这 个 集合 实际 上 是 一 个 动态 的 任意 类 型 对 象 的 数组 ， 也 即 ， 它 是 对 任意 


类 的 对 象 的 引用 的 集合 。 而 正 是 它 实 现 了 这 种 可 迭代 的 接口 。 
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不 论 该 语句 在 文本 顺序 中 是 否 应 该 在 第 一 条 语句 之 前 或 者 之 后 来 执行 。 当 语句 的 执行 顺序 几乎 
与 语句 出 现 的 顺序 相同 时 ， 可 读 性 为 最 好 ， 在 我 们 的 情形 中 ， 语 句 出 现 的 顺序 意味 着 自 顶 往 下 ， 


这 是 我 们 习惯 的 顺序 。 这 样 就 给 goto 语 句 设 以 限制 ， 使 得 历史 注释 


它们 只 能 够 在 程序 中 由 上 往 下 来 转移 控制 ， 以 便 在 部 分 程 
度 上 减轻 这 种 问题 。goto 语 名 允许 在 针对 错误 或 非 寻 常情 
况 作 出 反应 时 ， 围 绕 代 码 段 来 转移 控制 ， 但 是 不 允许 用 于 
建立 任何 类 型 的 循环 。 

少数 语言 的 设计 没有 包括 goto 语 句 ， 例 如 Java、Python 
和 Ruby; 然而 ， 当 前 流行 的 大 多 数 语言 中 都 包括 了 goto 语 
句 。Kernighan 和 Ritchie (Kernighan and Ritchie，1978) 称 
goto 语 句 可 能 被 无 限 地 滥用， 但 它 仍然 被 包括 进 Ritchie 的 话 
言 C 中 。 在 一 些 删除 了 goto 语 句 的 语言 里 ， 提 供 了 其 他 的 一 
些 控制 语句 ， 通 常 典型 地 是 以 循环 退出 的 形式 来 代替 goto 
语句 。 

较 新 的 语言 C# 包 括 了 goto 语 句 ， 虽 然 作 为 C# 语 言 基础 
的 Java 并 没有 包括 goto 语 句 。C# 中 的 goto 语 句 的 一 种 合法 
使 用 是 将 它 用 于 switch 语 句 中 ， 我 们 曾经 在 第 8.2.2.2 节 中 


尽管 有 一 些 富有 创见 的 人 士 
很 早 就 提议 过 ， 但 还 是 Edsger 
Dijkstra 在 给 计算 机 界 广 为 阅读 的 
材料 里 首先 揭露 了 goto 语 揣 的 危 
险 性 。 他 在 信 中 提醒 道 ，“goto 
语 身 的 形式 太原 始 ; 它 给 制造 程 
序 混乱 提供 了 太 多 机 会 ”(Dijkstra， 
1968a) 。 在 Dijkstra 对 于 goto 语 向 
的 观 ,点 发 表 之 后 的 前 几 年 ， 很 多 
人 公开 争论 是 否 应 该 禁止 或 者 至 
少 限制 goto 语 向 。 在 一 些 并 不 支 
持 完 全 广 除 goto 语 向 的 人 中 ， 便 
有 Donald Knuth; 他 争辩 道 ， 有 
时 候 goto 语 向 的 效率 超过 了 它 对 
可 读 性 的 损害 (Knuth，1974)， 


bheit. 

所 有 那些 曾 在 8.4.3 节 中 讨论 过 的 循环 退出 语句 ， 实 际 上 都 是 经 过 装饰 的 goto 语 句 。 然 而 它 
们 都 是 被 严格 限制 的 goto 语 句 ， 并 对 可 读 性 不 产生 危害 。 其 至 还 可 以 说 ， 它们 在 事实 上 改进 了 
可 读 性 ， 因 为 如 果 不 使 用 这 些 语 句 ， 会 产生 非常 难于 理解 、 缠 线 不 清 且 不 自然 的 代码 ， 


8.5 守卫 的 命令 


DiUkstra 提 议 了 一 些 新 颖 且 形式 十 分 不 同 的 选择 结构 和 循环 结构 (Dijkstra，1975)。 他 的 动 
负 征 要 提供 一 种 可 以 支持 程序 设计 方法 学 的 控制 语句 ， 使 用 这 种 方法 学 来 确保 开发 期 间 的 正 兢 
性 ， 而 不 是 依赖 于 对 已 完成 程序 的 验证 与 测试 来 确保 程序 的 正确 性 。Dijkstra 对 这 种 方法 学 进行 
了 描述 (Dijkstra，1976)。 另 一 个 开发 守卫 命令 的 动机 是 并 发 程序 中 有 时 需要 的 非 决 定论 ， 第 
13 董 将 其 进行 讨论 。 另 一 个 动机 是 具有 守卫 命令 可 能 引起 的 逐步 增加 的 清晰 性 。 简 单 地 讲 ， 守 
卫 他 令 构 造 中 的 选择 构造 的 可 选段 能 被 独立 地 认为 构造 的 任何 其 他 部 分 ， 这 对 常用 程序 设计 语 
言 的 选择 构造 是 不 正确 的 。 

我 们 在 这 一 章 里 将 概述 守卫 的 命令 ， 因 为 它们 是 为 后 来 在 CSP (Hoare, 1978) 和 Ada 这 两 
种 语言 中 的 并 发 程序 设计 所 开发 的 两 种 语言 学 机 制 的 基础 。 关 于 Ada 中 的 并 发 ， 将 在 第 13 音 中 37 
讨论 。 它 们 也 被 用 在 Haskell 中 进行 函数 的 定义 ， 我 们 将 在 第 15 章 中 讨论 这 一 点 。 

Dijkstra 的 选择 构造 具有 以 下 形式 ; 

if < 布尔 表达 式 > -> < 语句 > 

[] < 布尔 表达 式 > -> < 语句 > 

EN ara 

[] < 布尔 表达 式 > -> < 语句 > 

fi 

RERE FEIRER EFi. AEREE ERÉ ALGOL 68。 使 用 
征 称 为 fatbars 的 小 模块 来 分 离 守卫 的 子 句 ， 并 允许 这 些 子 句 成 为 语句 序列。 在 选择 构造 中 的 每 
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一 行 ， 都 由 布尔 表达 式 (守卫 ) 和 语句 或 称 为 守卫 命令 的 语句 序列 组 成 。 

这 种 选择 构造 具有 多 向 选择 的 外 观 ， 然 而 它 的 语义 却 完 全 不 同 。 在 执行 期 间 ， 每 一 次 执行 
到 这 种 构造 时 ， 都 要 计算 所 有 的 这 些 布尔 表达 式 。 如 果 有 一 个 以 上 的 表达 式 为 真 ， 就 要 非 确定 
地 选择 执行 对 应 的 语句 之 一 。 一 种 实现 方法 是 总 是 选择 与 第 一 条 为 真 的 布尔 表达 式 相 关联 的 语 
句 。 因 此 ， 程 序 的 正确 性 会 取决 于 所 选择 的 这 一 条 语句 (在 这 些 与 为 真 的 布尔 表达 式 相关 联 的 语 
句 中 )。 如 有 果 所 有 的 表达 式 都 不 为 真 ， 就 会 产生 引起 程序 终止 的 运行 时 错误 。 这 就 迫使 程序 人 员 
考虑 并 列 出 所 有 的 可 能 性 ， 如 同 Ada 语 言 中 的 case 语 名 那样 。 考 虑 下 面 的 例子 ; 


if i= 0 -> sum := sum + i 
[] i > j -> sum := sum + j 
[] j > i -> sum := sum + i 
fi 


MAL = 0 且 j > i, 这 种 构造 将 在 第 一 条 与 第 三 条 赋值 语句 之 间 非 确定 地 选择 。 如 果 1i 
等 于 j 并 且 不 为 零 ， 则 出 现 运 行 时 错误 ， 因 为 所 有 的 这 些 条 件 都 不 为 真 。 

这 种 构造 可 能 是 允许 程序 人 员 说 明 执 行 次 序 的 一 种 漂亮 方式 ， 然 而 在 某 些 情况 下 却 是 不 恰 
当 的 。 例 如 ， 为 了 找 出 两 个 数字 之 中 较 大 的 一 个 ， 我 们 可 以 使 用 

if x >= y -> max := x 


[] y >= x -> max := y 
fi 


这 里 进行 的 是 计算 所 需要 结果 ， 但 却 并 没有 过 分 地 说 明 怎样 来 计算 。 尤 其 是 ， 如 果 当 x 与 y 
相等 时 ， 我 们 将 x 与 y 中 的 哪 一 个 赋 给 max 都 没有 关系 。 这 是 由 语句 的 非 确定 语义 提供 的 一 种 抽 
象形 式 。 

现在 ， 芳 虑 用 传统 程序 设计 语言 选择 器 编码 的 同一 过 程 : 


if (x >= y) 


max = x; 
else 

max = y; 
这 也 能 编码 为 : \ 
if (x >y) 

max = x; 
else 

max = y; 


这 两 种 构造 并 没有 实际 的 差异 。 当 x 等 于 y 时 ， 第 一 种 赋值 x 给 max， 在 同样 情形 下 ， 第 二 
种 赋值 y 给 max。 对 这 两 种 构造 的 选择 复杂 化 了 其 代码 和 正确 性 证 明 的 形式 分 析 。 这 是 一 个 为 什 
么 由 Dijkstra 开 发 守卫 命令 的 原因 。 

要 对 守卫 的 命令 的 语义 做 出 精确 描述 是 十 分 困难 的 。 虽 然 流程 图 并 不 是 程序 设计 的 理想 工 
有 具 ， 但 有 时 对 于 语义 的 描述 还 会 有 些 帮 助 。 图 8-1 是 一 种 描述 Dijkstra 所 使 用 的 选择 器 语句 的 流 
程 图 。 注意 ， 这 种 流程 图 稍 欠 精确 ， 这 也 反映 出 在 获取 守卫 的 命令 的 语义 方面 存在 的 困难 。 

由 Dijkstra 提 议 的 循环 结构 具有 这 种 形式 : 

do < 布尔 表达 式 > -> < 语句 > 

[] < 布尔 表达 式 > -> < 语句 > 

ee 


[] < 布尔 表达 式 > -> < 语句 > 
od 
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计算 所 有 布尔 表达 3 
Y 


随机 选择 一 个 为 真 的 布 
尔 表 达 式 





图 8-1 Dijkstra 的 选择 器 语句 所 使 用 方式 的 流程 图 


这 种 构造 的 语义 为 ， 在 每 一 次 的 重复 中 计算 所 有 的 布尔 表达 式 。 如 果 有 一 个 以 上 的 布尔 表 
达 式 为 真 ， 其 中 相关 联 语 句 之 一 就 被 非 确定 地 选择 执行 ， 此 后 ， 将 再 一 次 地 计算 所 有 的 布尔 表 
达 式 。 当 所 有 的 布尔 表达 式 都 为 假 时 ， 循 环 终止 。 

考虑 下 面 的 问题 。4 个 变量 ql1，q2，q3 和 q4 的 值 经 过 了 重新 安排 ,使 得 ql1<q2<q3<q4。 
没有 守卫 命令 ,一 个 直接 的 解决 方案 是 ， 把 4 个 值 放 入 数组 ， 对 该 数组 排序 ， 然 后 从 数组 中 赋值 
回 标 量变 量 ql1、q2、q3 和 q4。 该 解决 方案 不 是 困难 的 ， 它 需要 一 些 好 的 代码 ， 特 别 是 必须 包 
含 排序 过 程 。 现 在 ， 考 虑 下 面 的 代码 ， 它 使 守卫 命令 来 解决 同样 的 问题 ,但 是 采用 了 一 种 更 精 
致 和 优雅 的 方法 。9 

do ql > q2 -> temp := ql; ql := q2; q2 := temp; 

[] q2 > q3 -> temp := q2; q2 := q3; q3 := temp; 

[] q3 > q4 -> temp := q3; q3 := q4; q4 := temp; 

od 

图 8-2 显 示 了 描述 Dijkstra 的 循环 语句 所 使 用 方式 的 一 种 流程 图 。 请 再 次 注意 ， 这 种 构造 的 
控制 流程 的 语义 不 能 够 完全 由 流程 图 来 描述 。 | 

Dijkstra 的 守卫 命令 的 构造 是 有 趣 的 ， 部 分 原因 是 因为 它们 介绍 了 语句 的 语法 和 语义 对 于 程 
序 验证 具有 什么 样 的 影响 力 ， 以 及 反 过 来 的 影响 。 当 使 用 goto 语 名 时 ， 程 序 验证 实际 上 是 不 可 
能 的 。 当 仅仅 使 用 逻辑 循环 和 选择 时 ， 或 者 ， 仅 使 用 守卫 的 命令 时 ， 程 序 验证 就 被 极 大 地 简化 。 
守卫 的 命令 的 公理 语义 已 被 很 方便 地 说 明 (Gries，1981) 。 然 而 很 明显 ， 与 对 应 的 传统 的 确定 
方法 相 比 ， 守 卫 命 令 在 实现 方面 极 大 地 增加 了 复杂 性 。 37 
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O 这 段 代码 以 稍微 不 同 的 形式 出 现在 文献 中 (Dijkstra, 1975) 。 
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8.6 结论 


我 们 已 经 描述 并 讨论 了 多 种 语句 层次 上 的 控 
制 结 构 ， 现 在 应 该 是 进行 简短 的 评估 的 时 候 了 。 

首先 ， 我 们 有 了 理论 上 的 结论 ， 即 对 于 表达 
计算 绝对 必要 的 只 有 顺序 、 选 择 及 先 测 试 迎 辑 循 
环 (Bohm and Jacopini，1966)。 这 个 结论 已 经 
被 希望 全 面 禁止 无 条 件 分 支 的 人 们 广泛 接受 与 应 
用 。 当 然 ， 即 使 没有 从 理论 上 找到 理由 ，goto 
语句 也 已 经 因为 太 多 的 实际 问题 而 遭受 谴责 。 一 
种 对 于 goto 语 句 的 合法 要 求 一 一 从 循环 中 提前 
退出 ,已 经 可 以 通过 高 度 限制 的 分 支 语 句 (如 
break) 而 得 到 满足 。 

对 于 B56hm 和 Jacopini 的 结论 的 一 种 明显 的 误 
用 ， 是 反对 任何 除 选 择 与 先 测试 循环 之 外 的 控制 
结构 的 论点 。 没 有 任何 一 种 广泛 应 用 的 语言 采用 
了 这 种 观点 ， 并 且 ， 因 为 它 在 可 写 性 与 可 读 性 上 
的 负面 影响 ， 我 们 怀疑 任何 语言 将 不 会 采用 这 种 
观点 。 仅 使 用 选择 以 及 先 测 试 循环 来 编写 的 程序 ， 
一 般 会 在 结构 上 不 大 目 然 ， 也 更 加 复杂 ， 因 此 写 
和 读 都 比较 困难 。 例 如 ，C# 中 的 多 向 选择 结构 
极 大 地 增进 了 C# 的 可 写 性 ， 而 没有 明显 的 副 作 
用 。 另 一 个 例子 则 是 许多 语言 中 的 计数 循环 结构 ， 
尤其 是 当 这 种 语句 的 形式 十 分 简单 时 ， 如 Ada 中 
的 情形 。 

是 否 值 得 将 已 被 提议 的 许多 其 他 控制 结构 
的 功能 也 包括 在 语言 中 还 不 太 清 楚 (Ledgard 
and Marcotty，1975)。 这 个 问题 在 很 大 程度 上 
取决 于 更 基本 的 问题 ， 即 是 否 必 须 尽 可 能 地 减 
小 语言 的 规模 。Wirth (1975) 和 Hoare (1973) 
都 十 分 坚决 地 支持 语言 设计 中 的 简单 性 。 对 于 
控制 结构 ， 人 简单 性 即 意味 着 在 一 种 语言 中 应 该 
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图 8-2 Dijkstra 的 循环 语句 所 使 用 方式 的 流程 图 


只 有 少量 的 控制 语句 ， 并 且 这 些 语句 都 应 该 是 十 分 简单 的 。 

人 们 设计 了 丰富 多 样 的 语句 层次 的 控制 结构 ， 这 反映 了 语言 设计 人 员 的 不 同 观念 。 经 过 所 
有 这 些 设计 、 讨 论 以 及 评 佑 之后， 对 于 究竟 应 该 将 哪些 控制 语句 包括 在 语言 中 仍然 没有 一 致 的 
看 法 。 当 然 ， 大 多 数 当 代 语 言 确实 具有 类 似 的 控制 语句 ， 但 它们 在 语法 和 语义 的 细节 上 仍然 具 
有 不 同 。 此 外 ， 是 否 应 该 在 语言 中 包括 goto 语 句 ， 各 种 语言 仍然 不 一 致 ，C++ 和 C# 是 包括 了 ， 


但 是 Java 则 没有 。 


最 后 一 点 ， 国 数 式 程序 设计 语言 和 逻辑 程序 设计 语言 中 的 控制 结构 都 与 在 这 一 章 中 描述 的 
控制 结构 十 分 不 同 。 关 于 上 述 两 种 语言 的 机 制 ， 将 分 别 在 第 15 章 和 第 16 章 中 进行 深入 讨论 。 
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小 结 


命令 式 语 言 的 控制 语句 具有 几 种 类 型 选择、 多 向 选择 、 循 环 以 及 无 条 件 分 支 。 

基于 C 的 语言 中 的 switch 语 句 是 多 向 选择 语句 的 代表 。C# 中 的 switch 语 句 不 允许 在 执行 了 所 选择 的 
语句 之 后 ， 接 着 执行 下 一 条 可 选择 的 语句 。 这 种 方式 就 避免 了 C 中 的 switch 语 名 的 可 靠 性 问题 。 

从 Fortran 中 的 计数 Do 语句 开始 ， 人 们 为 高 级 语言 设计 了 许多 不 同 的 for 循 环 语句 。 就 复杂 性 而 言 ， 
Ada 的 for 语 名 很 简单 ， 它 十 分 优雅 地 实现 了 最 常用 的 计数 循环 形式 。C 的 for 语 句 是 最 具有 灵活 性 的 循环 
构造 ， 虽 然 它 的 灵活 性 导致 了 一 些 可 靠 性 问题 。 

基于 C 的 语言 都 具有 退出 循环 语句 ， 这 些 语 句 取代 了 最 常用 的 goto 语 句 。 

茎 于 数据 的 迭代 器 是 处 理 数据 结构 (如 链表 、 散 列 及 树 结构 ) 的 循环 构造 。 基 于 C 的 语言 中 的 for 语 句 
允许 用 户 为 用 户 定 义 的 数据 结构 建造 选 代 器 。Perl 和 C# 中 的 foreach 语 句 是 为 标准 数据 结构 预定 义 的 欠 代 
旺 。 在 当代 面向 对 象 的 语言 中 ， 使 用 标准 接口 来 说 明 集合 的 迭代 器 ， 而 标准 接口 集合 则 由 设计 人 员 来 完成 。 

无 条 件 分 支 ， 或 goto 语 句 ， 是 大 多 数 命令 式 语 言 的 组 成 部 分 。 它 所 具有 的 问题 已 经 被 广泛 地 讨论 并 
引发 争论 。 当 前 达成 的 一 致 是 应 该 将 它 保留 在 大 多 数 的 语言 中 ， 但 对 于 它 所 具有 的 危险 性 ， 应 该 通过 程序 
设计 的 规定 将 其 减 到 最 小 程度 。 

Dijkstra 的 守卫 的 命令 是 具有 正面 理论 特征 的 另 一 种 控制 结构 。 尽 管 它们 还 没有 被 任何 一 种 语言 采用 
为 控制 结构 ， 但 它 的 部 分 语义 已 经 出 现在 CSP 和 Ada 的 并 发 机 制 中 ， 还 出 现在 Haskell 的 函数 定义 中 。 


复习 题 

1. 控制 结构 的 定义 是 什么 ? 

2. 块 的 定义 是 什么 ? 

3. 选择 结构 的 设计 问题 是 什么 ? 

4. 关于 复杂 语句 的 Python 设计 ， 什 么 是 不 常用 的 ? 

5. 对 于 双向 选择 器 的 伐 套 问题 ， 有 哪些 常见 的 解决 办 法 ? 

6. 多 问 选 择 语句 的 设计 问题 是 什么 ? 

7. C 的 多 癌 选 择 语 名 有 什么 是 非 同 寻 常 的 ? 在 这 种 设计 中 有 什么 样 的 设计 权衡 ? 
8. 解释 为 什么 C# 中 的 switch 语 句 比 Java 中 的 switch 语 句 更 安全 ? 

9. 计数 控制 的 循环 语句 有 哪些 设计 问题 ? 
10. 什么 是 先 测 试 循环 语句 ? 什么 是 后 测试 循环 语句 ? 
11. C++ 中 的 for 语 句 与 Java 中 的 for 语 句 之 间 有 什么 不 同 ? 
12. 逻辑 控制 循环 语句 的 设计 问题 是 什么 ? 

13. 开发 用 户 定位 的 循环 控制 语句 有 哪些 主要 理由 ? 

14. C# 中 的 break 语 句 比 C 中 的 break 语 名 有 哪些 优越 性 ? 

15. C++ 中 的 break 语 名 与 Java 中 的 break 语 句 有 什么 不 同 ? 

16. 什么 是 用 户 定义 的 循环 控制 ? 

17. 哪 种 并 用 程序 设计 语言 的 设计 部 分 地 借鉴 了 Dijkstra 的 守卫 的 命令 ? 


练习 题 

1. 描述 三 种 需要 计数 循环 与 逻辑 循环 相 结合 的 构造 的 情形 。 

2. 人 研究 (Liskov etal., 1984) 文献 中 CLU 的 迭代 器 的 特性 ， 并 确定 它 的 优点 及 人 缺点。 

3. 将 Ada 中 的 控制 语句 系列 与 C# 中 的 控制 语句 系列 进行 比较 ， 决 定 它们 中 哪 一 个 更 好 ， 并 说 明 为 什么 。 
4. 在 复合 语句 中 使 用 独特 的 终止 保留 字 的 利 与 整 各 是 什么 ? 

5. 对 于 Python 控 制 构 造 中 指定 复杂 语句 的 缩 进 的 使 用 ， 参 数 的 利 商 是 什么 ? 

6. 分 析 对 控制 语句 使 用 终止 保留 字 ， 潜 在 的 可 读 性 问题 是 什么 。 这 些 终止 保留 字 是 它 对 应 的 起 始 保留 字 
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的 反 回 拼 法 ， 如 ALGOL 68 中 的 保留 字 case 与 esac。 例 如 ， 考 虑 常见 打字 输入 错误 ， 如 将 两 个 相 邻 的 

字符 翻转 。 

.使 用 科学 引证 索引 来 查找 一 篇 曾经 引用 过 (Knuth, 1974) 的 文章 。 阅 读 这 篇 文章 并 阅读 Knuth 的 论文 ， 

写 一 篇 文章 来 概述 关于 goto 语 名 争论 的 两 个 方面 。 

8. 在 一 篇 关于 goto 语 句 的 争论 的 文章 中 ，Knuth (1974) 提议 一 种 能 允许 多 个 出 口 的 循环 控制 构造 。 阅 

读 这 篇 文章 并 写 出 这 种 构造 的 操作 语义 描述 。 

文 持 与 反对 在 Java 的 控制 语句 中 仅 使 用 布尔 表达 式 的 论点 各 是 什么 (与 在 C 和 C++ 语 言 中 人 允许 算术 表达 

式 相 反 )? 

10. 在 Ada 中 ，case 构 造 的 选择 列表 必须 是 穷 举 的 ， 从 而 在 控制 表达 式 中 将 不 会 出 现 没 有 被 表示 的 值 。 但 
在 C+t+ 中 ， 可 以 通过 default 选 择 器 在 运行 时 截 住 没有 被 表示 的 值 。 如 果 没 有 default 选 择 器 的 话 ， 一 
个 没有 被 表示 的 值 便 可 能 会 导致 整个 结构 被 跳 越 。 这 两 种 设计 的 优点 与 缺点 各 是 什么 (Ada 与 C++)? 

11. 解释 Java 中 的 for 语 句 具 有 什么 优点 与 缺点 ? 并 比较 Ada 中 的 for 语 句 。 


程序 设计 练习 题 


1. 在 指定 的 语言 中 ， 使 用 循环 结构 来 重新 编写 下 面 的 伪 码 程序 段 ; 
k= (9 + 139.7 27 


~ 


Q 


loop: 
if k > 10 then goto out 
k=k+1 
L=-3* kel 
goto loop 

GUEC: sou 

a. Fortran 95 

b. Ada 

c.C, C++, Javan #C# 

d. Python 

e. Ruby 

假设 所 有 的 变量 都 为 整数 类 型 。 讨 论 对 于 这 段 代 码 ， 哪 一 种 语言 具有 最 佳 的 可 写 性 ， 最 佳 的 可 读 性 ， 或 

者 两 者 的 结合 是 最 佳 的 。 

2. 重新 做 程序 设计 练习 题 1， 这 次 所 有 的 变量 和 常量 都 为 浮 点 数 类 型 ， 并 且 将 语句 ， 

=k + 4 

改写 为 

kak # 1,2 

3. 使 用 下 面 列 举 的 语言 中 的 多 向 选择 语句 重新 编写 下 面 的 代码 段 ; 

iT ((K == 1) [| (k == 2)) fe 2*k-1 

if ((k == 3) || (k == 5) j=3*k+1 

if (k == 4) j=4* k-1 

if ((k == 6) || (k == 7) || (k == 8)) j=k-2 


a. Fortran 95 (必须 要 掌握 ) 

b. Ada 

Cc.C、C++、Java 或 者 C# À 

d. Python À 

e. Ruby 

假设 所 有 的 变量 都 为 整数 类 型 。 讨 论 对 于 这 段 代 码 ， 使 用 这 些 语言 的 相对 优点 。 
4. 考虑 下 面 的 C 程 序 段 。 重 新 编写 这 段 程 序 ， 但 不 使 用 goto 或 者 break 语 句 。 


让 
for (i = 0; i < 3; i++) { 
switch (j + 2) { 
case 3: 
case 2: j--; break; 
case 0: j += 2; break; 
default: j = 0; 


} 
if (j > 0) break; 
j =3-i 

} 


Wn 


.Rubin 在 一 封 给 C4CM 的 编辑 的 信 中 (Rubin，1987) ， 使 用 了 下 面 的 代码 段 来 作为 证 据 ， 试 图 证 明 某 些 
具有 goto 语 句 的 代码 的 可 读 性 比 没 有 goto 语 句 的 同等 代码 要 好 。 这 段 代码 从 名 为 x 的 nxn 的 整数 矩阵 里 
找到 它 的 第 一 个 只 有 零 值 的 行 。 

for (i = 1; i <= n; i++) { 
for (j = 1; j <= n; j++) 

if (x[iJ}[j] != 0) 
goto reject; 
println ('First all-zero row is:', i); 
break; 
reject: 
} 

使 用 下 面 的 语言 重新 编写 这 段 代 码 ， 但 不 使 用 goto 语 句 : C、C++、Java、C# 或 者 Ada。 

将 你 的 代码 的 可 读 性 与 上 面 这 段 代码 的 可 读 性 进行 比较 。 

6. 考虑 下 面 的 程序 设计 问题 : 必须 使 用 三 个 整数 变量 的 值 一 一 first，second 以 及 third 来 替代 三 个 变 
量 一 max，mid 以 及 min， 并 且 不 使 用 数组 或 用 户 定 义 的 或 预定 义 的 子 程序 ， 而 要 使 得 它们 具有 明显 的 
意义 。 针 对 这 个 问题 ， 编 写 出 两 种 解决 方案 ， 一 种 使 用 嵌 套 的 选择 结构 ， 但 另 一 种 则 不 使 用 这 种 结构 。 
比较 这 两 种 方法 的 复杂 性 ， 以 及 这 两 种 方法 的 可 靠 性 。 

7. 使 用 Ada 语 言 编 写 下 面 的 Java 中 的 for 结 构 ; 
int i, j, n = 100; 
for (i = 0, j = 17; i <n; itt; j--) 

sum += i * j + 3; 
8. 使 用 C 语 言 中 的 if 以 及 goto 语 句 ， 重 新 编写 程序 设计 练习 题 4 中 的 C 程 序 段 。 
9. 使 用 Java 语 言 中 的 switch 构 造 ， 重 新 编写 程序 设计 练习 题 4 中 的 C 程 序 段 。 
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子 程序 是 程序 的 基本 构件 ， 并 因此 是 程序 设计 语言 设计 的 最 重要 概念 之 一 。 我 们 现在 来 研 
究 关 于 子 程序 的 设计 ， 包 括 参数 传递 的 方法 、 局 部 引用 环境 、 重 载 子 程序 、 通 用 子 程序 ， 还 包 
括 别 名 使 用 的 问题 ， 以 及 与 子 程序 相关 的 一 些 副 作用 问题 。 我 们 也 包括 了 对 于 提供 对 称 的 程序 
单位 控制 的 协同 程序 的 一 些 简短 讨论 。 

关于 子 程序 的 实现 方法 ， 将 在 第 10 章 讨论 。 


9.1 概述 


一 种 程序 设计 语言 可 以 包括 两 种 基本 的 抽象 设施 : 过 程 抽 象 与 数据 抽象 。 在 高 级 程序 设计 
语言 的 早期 历史 阶段 ， 仅 仅 承 认 并 包括 了 过 程 抽象 。 过 程 抽象 是 所 有 程序 设计 语言 中 的 主要 概 
念 。 然 而 从 20 世 纪 80 年 代 开 始 ， 许 多 人 相信 数据 抽象 也 同等 重要 。 关 于 数据 抽象 ， 我 们 将 在 第 
11 章 里 详细 讨论 。 

第 一 台 可 编程 的 计算 机 是 建造 于 20 世 纪 40 年 代 的 Babbage 的 分 析 引 擎 (Analytical Engine), 
它 具 有 在 程序 中 的 一 些 不 同位 置 上 重复 使 用 一 系列 指令 卡片 的 能 力 。 而 现代 的 程序 设计 语言 是 
将 这 样 的 语句 系列 编写 成 为 子 程序 。 这 种 重复 使 用 导致 了 在 几 个 不 同方 面 的 节省 ， 从 存储 空间 
到 程序 的 编码 时 间 。 这 样 的 重复 使 用 也 是 一 种 抽象 ， 因 为 它 使 用 一 条 放置 于 程序 之 中 的 子 程序 
调用 语句 代替 了 子 程序 的 计算 细节 。 不 是 在 程序 中 解释 如 何 进行 计算 ， 而 只 需要 通过 一 条 调用 
语句 就 启动 了 这 种 解释 〈 即 子 程序 中 的 语句 系列 ) ， 从 而 达到 从 各 种 细节 中 抽象 出 来 的 效果 。 通 
过 展示 程序 的 逻辑 结构 ， 而 隐藏 其 底层 的 细节 ， 这 样 就 提高 了 程序 的 可 读 性 。 

面向 对 象 语言 中 的 方法 与 本 章 中 讨论 的 子 程序 十 分 接近 。 方 法 与 子 程序 存在 不 同 的 主要 方 
面 是 对 于 它们 的 调用 ， 以 及 它们 与 类 及 对 象 相关 联 的 方式 。 虽 然 我们 将 在 第 12 章 讨论 这 些 方 
法 的 特征 ， 但 是 对 于 这 些 方法 与 子 程序 所 共享 的 一 些 特性 ， 如 参数 和 局 部 变量 ， 还 是 由 本 章 
来 前 述 。 


9.2 子 程序 的 基本 原理 
9.2.1 子 程序 的 一 般 特 征 


本 章 讨论 的 所 有 子 程序 ， 除 了 在 第 9.11 节 里 描述 的 协同 程序 以 外 ， 都 具有 下 面 的 特征 ， 

。 每 一 个 子 程序 都 只 有 一 个 人 口 。 

© 在 被 调用 子 程序 的 执行 期 间 ， 调 用 程序 单位 被 停止 执行 ， 这 意味 着 在 任何 给 定时 刻 ， 只 

有 一 个 子 程序 在 执行 。 

。 当 子 程序 的 执行 结束 上 时， 总 是 将 控制 返回 到 调用 程序 。 

与 上 面 的 特征 不 同 的 子 程序 是 协同 程序 ( 见 第 9.11 节 ) 和 并 发 程序 单元 (第 13 章 )， 

虽然 Fortran 子 程序 可 以 具有 多 个 人 口 ， 但 这 种 特殊 类 型 的 入 口 相对 地 并 不 重要 ， 因 为 它 不 
提供 任何 不 同 的 基本 功能 。 因 而 在 这 一 章 里 ， 我 们 将 忽略 Fortran 子 程序 中 的 多 个 人 口 的 可 能 性 . 
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9.2.2 基本 定义 


子 程序 定义 描述 的 是 子 程序 的 接口 以 及 子 程序 的 抽象 行为 。 子 程序 调用 是 显 式 地 要 求 执行 
dL I indi dla T bays fi 
程序 为 活路 的。 关于 两 种 基本 类 型 的 子 程序 
讨论 。 

定义 中 的 第 一 个 部 分 是 子 程序 首部 ， 它 具有 几 个 目的 。 第 一 ， 它 说 明 下 面 的 语法 单位 是 关 
于 某 个 特殊 类 型 子 程序 的 定义 ?。 子 程序 的 类 型 通常 由 特殊 字 来 指定 。 第 二 ， 首 部 给 子 程序 提 
供 一 个 名 称 。 第 三 ， 首 部 可 以 通过 可 选 的 方式 来 说 明 一 列 参 数 。 

考虑 下 面 的 首部 例子 : 


Subroutine Adder(parameters) 


这 是 一 个 名 为 Adder 的 Fortran 子 程序 的 首部 。 在 Ada 中 ， 这 个 子 程序 的 首部 将 会 是 


procedure Adder(parameters) 


Python 子 程序 的 首部 有 下 面 的 形式 : 


def adder(parameters): 


在 除了 Fortran 和 Ada 的 语言 中 ， 子 程序 的 首部 不 会 出 现 特殊 字 。 这 些 语言 只 有 一 种 子 程序 ， 
Bea (也 许 还 有 方法 )， 而 函数 的 首部 是 由 上 下 文 来 识别 ， 而 不 是 通过 特殊 字 来 识别 的 。 例 如 ， 
在 C 中 


void adder(parameters) 


这 是 名 为 adder 的 函数 的 首部 ， 这 里 的 void 指 示 这 个 函数 将 不 会 返 何 任何 数值 。 

因为 市 有 复合 语句 ，Python 函 数 体 的 语句 必须 采用 缩 进 风格 ， 其 结尾 由 未 缩 进 的 第 一 个 语 
句 指明 〈 第 一 个 语句 接 在 函数 定义 之 后 ) 。 使 Python 函数 区 别 于 其 他 常用 程序 设计 语言 的 一 个 特 
征 是 ， 函 数 def 语 句 是 可 执行 的 。 当 执行 def 语 句 时 ， 它 把 给 定 的 名 字 赋 值 给 给 定 的 函数 体 。 
直到 执行 完 函数 的 def 语 句 才 能 调用 该 函数 。 考 虑 下 面 框架 的 例子 : 


Re anc 
def fun(...): 





else 
def fun(...): 


如 果 执 行 上 述 选择 结构 的 then 子 句 ， 则 调用 其 子 句 中 的 fun 函数 ， 而 不 是 else 子 句 中 
NW; 反之 ， 如 果 选 择 else 子 句 ， 则 调用 else 子 句 中 的 fun 函 数 ， 而 不 是 then 子 句 中 的 。 

与 其 他 程序 设计 语言 的 子 程 序 相 比 ，Ruby 函 数 存在 着 一 些 有 趣 的 不 同 之 处 。Ruby 方 法 通常 
在 类 定义 时 定义 ,但 也 可 以 在 类 定义 外 定义 ， 此 时 ， 它 们 被 认为 是 根 对 象 object 的 方法 。 调 
用 这 样 的 方法 不 需要 带 对 象 接收 器 ， 就 像 是 C 或 C++ 的 国 数 一 样 。 如 果 Ruby 方 法 的 return 语 铝 
后 没有 跟 表 达 式 ， 则 返回 nil， 如果 后 面 跟 了 表达 式 ， 则 返回 该 表达 式 的 值 ， 如 果 后 跟 多 个 表 
达 式 ， 则 返回 所 有 表达 式 值 的 数组 。 如 果 调 用 Ruby 方 法 时 不 带 接收 器 ， 则 假定 self。 如 果 类 
中 没有 该 名 称 的 方法 ， 则 搜索 封闭 类 ， 一 直到 object (如 果 需 要 )。 

子 程序 的 参数 描绘 《有 时 也 称 为 签名 ) 是 它 所 具有 的 形 参 的 数目 、 次 序 以 及 类 型 。 一 个 子 


日 一 些 程序 设计 语言 包括 了 两 种 类 型 的 子 程序 ， 即 过 程 与 函数 。 
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程序 的 协议 是 这 个 子 程序 的 参数 摘 绘 加 上 它 的 返回 类 型 ， 如 果 它 是 函数 的 话 。 在 一 些 语言 中 ， 
子 程序 具有 类 型 ， 这 些 子 程序 的 类 型 就 通过 子 程序 协议 来 定义 。 

子 程序 也 可 以 具有 声明 和 定义 。 这 些 声 明和 定义 与 C 中 变量 的 声明 和 定义 很 相似 ， 可 以 使 
用 这 些 声 明 来 提供 类 型 信息 ， 但 是 并 不 能 够 被 用 来 定义 变量 。 在 C 中 使 用 extern 修 饰 词 的 变量 
声明 用 来 指定 在 函数 中 使 用 的 变量 在 其 他 地 方 定义 (不 在 使 用 的 地 方 定义 )。 子 程序 的 声明 提供 
子 程 序 的 协议 ， 但 并 不 包括 子 程序 体 。 不 允许 向 前 引用 子 程序 是 必要 的 。 实 施 变 量 与 子 程序 的 
静态 类 型 检测 都 需要 这 些 声 明 。 对 于 子 程序 ， 则 必须 检测 参数 的 类 型 。 在 C 和 C++ 程序 中 ， 子 
程序 声明 非常 普 志 ， 它 们 被 称 为 原型 (prototype ) 。 

在 大 多 数 其 他 语言 《除了 C 和 C++) 中 ， 子 程序 不 需要 声明 ， 因 为 这 些 语 言 并 不 要 方法 的 定 
义 必须 实施 于 方法 被 调用 以 前 。 


9.2.3 参数 


子 程序 通常 描述 计算 。 有 两 种 方法 让 子 程序 能 够 获取 它 所 要 处 理 的 数据 : 通过 对 非 局 部 变 
量 的 直接 访问 〈 在 别处 被 声明 ， 但 在 子 程序 中 可 见 ) ， 或 者 通过 参数 传递 。 经 参数 传递 的 数据 是 
通过 对 子 程序 为 局 部 的 名 称 来 存 取 的 。 参 数 传递 比 对 非 局 部 变量 的 直接 访问 更 灵活 。 实 质 上 ， 
对 将 要 处 理 的 数据 采用 参数 存 取 的 子 程序 是 一 种 所 谓 参 数 化 的 计算 。 这 种 计算 能 够 在 经 参数 接 
受 的 任何 数据 之 上 进行 〈 假 设 这 些 参数 的 类 型 正 是 子 程序 期 待 的 参数 ) 。 如 果 数 据 是 通过 非 局 部 
变量 来 存 取 的 ， 可 能 在 不 同 数据 上 进行 计算 的 唯一 方式 是 在 子 程序 的 调用 之 间 将 新 的 值 赋 给 非 
局 部 变量 。 对 于 非 局 部 变量 的 大 量 访问 ， 将 导致 可 靠 性 程度 的 降低 。 变 量 在 需要 对 它们 进行 存 
取 的 子 程序 内 可 见 ， 这 是 必要 的 ;但 它们 常常 在 不 需要 被 存 取 的 地 方 也 成 为 可 见 的 。 关 于 这 个 
问题 ， 我 们 曾经 在 第 5 章 中 讨论 过 。 

虽然 方法 也 通过 非 局 部 的 引用 和 参数 来 存 取 外 部 的 数据 ， 但 方法 所 处 理 的 主要 数据 是 实施 
方法 调用 的 对 象 。 然 而 ， 当 一 个 方法 确实 存 取 非 局 部 的 数据 时 ， 所 产生 的 可 靠 性 问题 就 与 非 方 
法 的 子 程序 中 一 样 。 另 外 在 一 种 面向 对 象 的 语言 中 ， 方 法 对 于 类 变量 (是 与 类 相关 联 的 变量 ， 
而 非 与 对 象 相关 联 的 变量 ) 的 存 取 将 涉及 到 非 局 部 数据 的 概念 ， 应 该 尽 可 能 地 避免 。 在 这 种 情 
次 下 ， 以 及 在 C 的 程序 进行 非 局 部 数据 的 存 取 的 情况 下 ， 方 法 将 可 能 具有 改变 一 些 非 自身 的 参 
数 或 者 一 些 非 局 部 数据 的 副作用 。 这 些 改变 将 使 得 方法 的 语义 复杂 化 ， 导 致 可 靠 程度 的 降低 。 

在 某 些 情况 下 ， 如 果 能 够 将 计算 而 不 是 数据 作为 子 程序 的 参数 来 传递 ， 将 十 分 方便 。 此 时 ， 
束 可 以 将 实现 这 种 计算 的 子 程序 名 作为 参数 来 使 用 。 关 于 参数 的 这 种 形式 将 在 第 9.6 节 中 讨论 。 
关于 数据 参数 ， 则 将 在 第 9.5 节 中 讨论 。 

子 程序 首部 中 的 参数 被 称 为 形 参 。 有 时 将 形 参 认为 是 虚 变 量 ， 因 为 它们 不 是 平常 音义 上 的 
变量 : 在 大 多 数 情况 下 ， 只 有 当 子 程序 被 调用 时 ， 它 们 才 与 存储 空间 相 绑 定 ， 并 且 这 种 绑 定 通 
前 经 过 了 一 些 其 他 的 程序 变量 。 

子 程序 的 调用 语句 必须 包括 子 程序 的 名 称 ， 以 及 一 组 将 与 子 程序 中 的 形 参 相 绑 定 的 参数 。 

这 些 参数 被 称 为 实 参 。 必 须 将 实 参与 形 参 相 区 别 ， 因 为 这 两 种 参数 在 形式 上 有 着 不 同 的 限制 ， 
它们 的 使 用 自然 也 相当 不 同 。 

儿 乎 在 所 有 的 程序 设计 语言 
在 向 单 地 按 位 置 进行 的 : 第 一 个 实 参与 第 一 个 形 参 相 绑 定 ， 依 此 类 推 。 这 样 的 一 些 参数 被 称 为 
位 置 参数 。 只 要 参数 表 相 对 短 ， 使 用 这 种 方法 将 实 参 与 形 参 关联 起 来 是 一 种 十 分 有 效 且 很 安全 
的 方法 。 

然而 当 参 数 表 很 长 时 ， 程 序 人 员 容 易 在 表 中 实 参 的 次 序 上 犯错 误 。 对 这 个 问题 的 一 种 解决 
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办 法 是 提供 一 些 关键 字 参 数 ， 这 种 方法 是 ; 将 一 个 与 实 参 相 绑 定 的 形 参 的 名 称 与 这 个 实 参 在 一 
起 说 明 。 关 键 字 参 数 的 优越 性 是 它们 能 够 以 任何 顺序 出 现 于 实 参 表 中 。 Python 中 的 过 程 就 可 以 
使 用 这 种 方法 来 调用 ， 如 
sumer (length = my length, 
list = my array, 
sum = my _ sum) 
在 这 里 ， Sumez 的 定义 中 具有 形 参 Length， List 以 及 Sum。 
使 用 关键 字 参 数 的 缺点 是 子 程序 的 使 用 人 员 必 须知 道 形 参 的 名 字 。 
际 了 关键 字 参 数 以 外 ，Ada、Fortran 95 和 Python 还 人 允许 位 置 参 数 ， 并 且 可 以 将 这 两 种 参数 
混合 在 一 个 调用 之 中 ， 如 


sumer(my length, 
sum = my sum, 
list = my array) 


这 种 形式 的 唯一 限制 是 ， 在 一 个 关键 字 参 数 出 现在 列表 中 以 后 ， 必 须 将 所 有 的 其 余 参数 关 
键 字 化 。 之 所 以 这 是 有 必要 的 ， 因为 在 关键 字 参 数 出 现 之 后 ， 参数 位 置 的 顺序 就 可 能 不 再 遵循 

在 Python、Ruby、C++、Fortran 95. Ada 以 及 PHP 中 ， 形 参 可 以 具有 默认 值 。 如 果 没 有 将 实 
参 传递 给 子 程序 首部 中 的 形 参 ， 就 可 以 使 用 形 参 的 默认 值 。 考 虑 下 面 的 Python 函 数 的 首部 : 


def compute pay(income, exemptions = 1, tax rate) 


参数 Bxemptions 可 以 不 出 现在 对 compute_Pay 的 调用 中 ， 但 当 它 确实 未 出 现时 ， 就 使 
用 整数 值 1。 在 一 个 Python 的 调用 中 ， 对 于 没有 出 现 的 实 参 不 使 用 逗号 ， 因 为 这 种 逗号 的 唯一 价 
值 是 指示 下 一 个 参数 的 位 置 ， 和 而 这 种 指示 在 这 种 情况 下 就 不 必要 了 ， 因 为 在 没有 出 现 的 实 参 之 
后 的 所 有 实 参 都 必须 被 关键 字 化 。 例 如 ， 考 虑 下 面 的 调用 ， 

pay = compute_pay(20000.0, tax_rate = 0.15) : 

在 不 支持 关键 字 参 数 的 C++ 中 ， 对 于 默认 参数 的 规则 必然 是 不 同 的 。 默认 参数 必须 出 现在 
最 后 面 ， 因 为 参数 与 位 置 相 关联 。 一 旦 一 个 默认 参数 在 调用 中 被 省 略 掉 ， 所 有 其 余 的 形 参 就 都 
必须 具有 默认 的 值 。 可 以 将 函数 Compute_Pay 的 C++ 函数 首部 编写 为 : 

float compute pay(float income, float tax rate, 

int exemptions = 1) 

注意 ， 这 里 的 参数 已 经 被 重新 安排 ， 以 便 将 具有 默认 值 的 参数 排 在 最 后 面 。 一 个 对 C++ 中 

的 compute_pay 函 数 的 调用 例子 为 


Pay = compute pay(20000.0, 0.15); 


在 形 参 不 具有 默认 值 的 大 多 数 语言 中 ， 一 个 调用 中 的 实 参数 目 必 须 与 子 程序 定义 的 首部 中 
的 形 参数 目 相 匹配 。 然 而 ， 在 C、C++、 Perl 以 及 JavaScript 中 ， 则 没有 这 项 要 求 。 当 一 个 调用 
中 的 实 参数 目 少 于 函数 定义 中 的 形 参 数目 时 ， 程序 人 员 就 有 责任 保证 这 些 参数 总 在 位 置 上 相对 
应 ， 并 且 保 证 子 程序 的 执行 是 有 意义 的 。 

虽然 这 种 允许 参数 数目 不 同 的 设计 显然 容易 5 引起 错误 ， 但 有 时 也 较为 方便 。 例 如 ，C 的 
PintE 国 数 就 可 以 打印 任何 数目 的 项 ( 数据 值 以 及 /或 者 字面 量 字 符 串 ) 

C# 克 许 它 的 方法 接受 不 同 数目 的 参数 ， 从 要 这 些 参数 都 具有 相同 的 类 型 。C# 中 的 方 法 使 用 
params 修 饰 符 来 说 明 形 参 。 方 法 的 调用 程序 可 以 传送 一 个 数组 或 者 一 组 表达 式 给 方法 ， 这 些 
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数组 或 表达 式 的 值 由 编译 器 放置 在 一 个 数组 中 ， 并 且 传 递 给 被 调用 的 方法 。 例 如 ， 考虑 下 面 的 
方法 : 
public void DisplayList(params int[] list) { 
foreach (int next in list) { 
Console.WriteLine("Next value {0}", next); 


如 果 将 DisplayList 定 义 为 类 Myclass 中 的 方法 ， 而 且 我 们 有 下 面 的 声明 : 
Myclass myObject = new Myclass; 
int[] myList = new int[6] {2, 4, 6, 8, 10, 12}; 


那么 就 可 以 使 用 下 面 的 这 两 种 方式 来 调用 DisplayList: 

myObject.DisplayList(myList); 

myObject.DisplayList(2, 4, 3 * x - 1, 17); 

Ruby 支 持 复杂 而 又 高 度 灵活 的 实 参 。 初 始 化 参数 是 表达 式 ， 表 达 式 的 值 对 象 能 被 传递 给 相 
应 的 形 参 。 初 始 化 参数 后 能 接 一 列 关键 的 => 值 对 ， 它 们 放置 在 一 个 匿名 的 散 列 中 ， 而 且 把 对 该 
散 列 的 引用 传递 给 下 一 个 形 参 。 这 些 用 来 替代 Ruby 不 支持 的 关键 字 参 数 。 散 列 项 后 能 接 一 个 由 
* 开 头 的 单一 参数 。 这 个 参数 称 为 数组 形 参 。 当 调用 方法 时 ， 数 组 形 参 设置 为 引用 一 个 新 的 
Array 对 象 。 所 有 余下 的 实 参 都 被 赋值 给 新 的 Array 对 象 的 元 素 。 如 果 对 应 数组 形 参 的 实 参 是 
一 个 数组 ， 那 么 它 必 须 以 一 个 * 开 始 ， 而 且 它 必须 是 最 后 的 实 参 。” 因 此，Ruby 支 持 与 C# 相 同 
形式 的 可 变数 量 的 参数 。 因 为 Ruby 数 组 能 存储 不 同 的 类 型 ， 因 此 它 对 传递 给 数组 的 实 参 有 相同 
类 型 没有 需要 。 

下 面 例子 简要 勾勒 出 函数 的 定义 ， 而 对 其 的 调用 说 明了 Ruby 的 参数 结构 : 

list = [2, 4, 6, 8] 

def tester(pl, p2, p3, *p4) 


end 


tester('first', mon => 72, tue => 68, wed => 59, *list) 
在 tester 内 部 ， 其 形 参 值 是 : 


plis 'first' 

p2is {mon => 72, tue => 68, wed => 59} 
p3 is 2 

p4is[4, 6, 8] 


Python 支持 与 Ruby 相 似 的 参数 。 初 始 化 形 参 在 大 多 数 常用 语言 中 都 是 相似 的 。 它 们 之 后 能 
紧 跟 一 个 常数 数组 〈 在 Rython 中 称 为 元 组 ) ， 该 数组 由 以 * 开 头 的 形 参 指定 。 调 用 子 程序 时 变 成 
数组 的 参数 接收 所 有 超出 对 应 的 初始 化 参数 范围 的 非 关 键 字 实 参 。 最 后 ， 由 两 个 * 开 头 的 形 参 指 
定 的 最 后 的 形 参 变 成 一 个 散 列 〈 在 Python 中 称 为 字典 ) 。 与 该 参数 对 应 的 实 参 是 关键 的 = 值 对 ， 
该 值 对 放置 在 散 列 形 参 中 。 考 虑 下 面 梗 要 的 例子 函数 和 对 其 的 调用 : 


def funl(pl, p2, *p3, **p4): 


日 ”并 不 完全 正确 ， 因 为 数组 形 参 后 能 接 一 个 以 & 开 始 的 方法 或 函数 。 


本 


funl(2, 4, 6, 8, mon=68, tue=72, wed=77) 


fun1 的 形 参 有 下 面 的 值 : 


plis 2 

p2 is 4 

p31s [6, 8] 

p4 is {'mon': 68, 'tue': 72, 'wed': 77} 


9.2.4 Rubyik 


在 大 多 数 其 他 程序 设计 语言 中 ， 处 理 数组 或 其 他 结构 的 数据 通过 和 迭代 带 有 循环 的 数据 结构 
并 处 理 循 环 中 的 每 个 数据 元 素来 完成 。 回 想 一 下 ，Ruby 包 括 其 数据 结构 的 迭代 器 方法 。 例 如 ， 
数组 结构 有 能 用 于 处 理 任 何 数组 的 迭代 器 方法 each。 在 Ruby 中 ， 它 通过 在 对 和 迭代 器 的 调用 上 
指定 一 块 代码 来 完成 。 由 花 括 号 或 ao-endq 对 界定 的 语句 序列 的 代码 块 仅 能 出 现在 接 下 来 的 方 
法 调用 里 。 而 且 ， 它 必须 在 同一 行 开 始 ， 作 为 最 少 的 调用 的 最 后 部 分 。 块 能 有 在 垂直 条 之 间 指 
定 的 形 参 。 传 递 给 被 调用 子 程序 的 块 是 其 本 身 ， 称 为 带 有 Yie1lq 语 句 ， 该 语句 包含 跟着 实 参 的 
Yield 你 留守 。yield 不 能 比 有 形 参 的 块 包括 更 多 的 实 参 。 从 块 返回 的 值 (给 调用 它 的 yield) 
是 块 中 最 后 的 表达 式 求 值 出 来 的 值 。 

磷 代 吏 通 第 用 来 处 理 一 个 存在 的 数据 结构 中 的 数据 。 然 后 ， 当 在 迭代 器 方法 中 计算 处 理 的 
数据 时 ， 它 们 也 能 使 用 到 。 考 虑 下 面 方法 的 简单 例子 和 两 个 对 其 的 调用 ， 它 们 都 包含 了 一 个 块 


# A method to compute and yield Fibonacci numbers up to a 
# limit 
def fibonacci(last) 
first, second = 1, 1 
while first <= last 
yield first 
first, second = second, first + second 
end 
end 


# Call fibonacci with a block to display the numbers 
puts "Fibonacci numbers less than 100 are:" 
fibonacci(100) {|num| print num, " "} 

puts # Output a newline 


# Call it again to sum the numbers and display the sum 

sum = 0 

fibonacci(100) {|num| sum += num} 

puts "Sum of the Fibonacci numbers less than 100 is: #{sum}" 


注意 ， 在 方法 中 ， 并 列 赋 值 的 使 用 与 Perl 中 很 相似 。 也 注意 ， 在 对 puts 的 参数 字符 串 中 的 
注释 #{...} 用 来 指定 把 闭合 表达 式 的 值 转换 为 一 个 字符 串 ， 并 插入 到 字符 字符 串 中 。 这 有 段 代 
码 的 输出 如 下 : 

Fibonacci numbers less than 100 are: 


11235 8 13 21 34 55 89 
Sum of the Fibonacci numbers less than 100 is: 232 


央 是 封闭 的 ， 这 意味 着 它们 保持 它们 定义 时 位 置 的 环境 ,包括 局 部 变量 和 当前 对 象 ， 而 不 
管 它们 在 哪里 调用 。 


U 
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9.2.5 过 程 与 函数 


存在 着 两 种 不 同类 型 的 子 程序 : 过 程 与 函数 ， 可 以 将 这 两 者 都 看 作 是 语言 的 扩充 方式 。 过 
程 是 定义 参数 化 计算 的 语句 系列 ， 通 过 单个 的 调用 语句 来 启动 这 些 计算 。 过 程 实际 上 定义 了 新 
的 语句 。 例 如 ， 因 为 Ada 中 不 存在 一 条 排序 语句 ， 用 户 就 可 以 建立 一 个 过 程 来 对 数据 数组 进行 
排序 , 并 且 用 对 这 个 过 程 的 调用 来 代替 缺乏 的 排序 语句 。 在 Ada 中 , 将 过 程 称 为 过 程 (procedures ) ， 
但 在 Fortran 中 则 将 过 程 称 为 子 程序 (subroutines ) 。 

通过 使 用 两 种 方法 ， 过 程 可 以 在 调用 程序 中 产生 结果 。 第 一 种 ， 如 果 存 在 一 些 不 是 形 参 的 
变量 ， 但 这 些 变量 在 过 程 和 调用 程序 单位 中 都 是 可 见 的 ， 过 程 就 可 以 改变 这 些 变量 。 第 二 种 ， 
如 采 子 程序 具有 人 允许 将 数据 转移 到 调用 程序 的 形 参 ， 这 些 形 参 也 可 以 被 改变 。 

国 数 在 结构 上 模仿 了 过 程 ， 但 在 语义 上 却 模 拟 自 数学 函数 。 如 果 一 个 函数 是 一 个 真正 的 
(函数 ) 模式 ， 就 不 会 产生 副作用 ， 也 就 是 说 ， 函 数 不 会 修改 它 的 参数 ， 也 不 会 修改 在 函数 之 外 
定义 的 任何 变量 。 事 实 上 ， 程 序 中 的 许多 函数 都 有 副作用 。 

畏 数 被 调用 时 包括 了 它们 在 表达 式 中 的 名 称 ， 连 同 所 需要 的 实 参 。 而 将 函数 执行 产生 的 值 
返回 给 调用 代码 ， 这 在 效果 上 替代 了 调用 本 身 。 例 如 ， 表 达 式 £ (x) 的 值 是 当 使 用 参数 x 调用 
时 所 产生 的 任何 值 。 一 个 不 产生 任何 副作用 的 函数 ， 它 所 返回 的 值 就 是 它 的 唯一 效果 ，。 

图 数 定义 新 的 用 户 定义 的 操作 符 。 例 如 ， 如 果 一 种 语言 没有 指数 操作 符 ， 则 可 以 编写 一 个 
图 数 来 计算 它 的 一 个 参数 以 另 一 个 参数 为 指数 的 乘 需 ， 并 返回 这 个 值 。 在 C++ 中 这 个 函数 的 首 
部 就 可 以 是 

float power(float base, float exp) 

它 可 以 通过 下 面 的 语句 来 调用 : 


result = 3.4 * power(10.0, x) 


C++ 的 标准 程序 库 已 经 包括 了 一 个 名 为 pow 的 类 似 函 数 。 将 这 个 函数 与 Perl 中 的 相同 操作 进 
行 比较 ; 在 Perl 中 ， 乘 需 是 语言 中 内 置 的 操作 : 

result = 3.4 * 10.0 ** x 

在 Ada、Python、Ruby、C++ 和 C# 中 ， 人 允许 用 户 通过 定义 新 的 函数 来 使 得 操作 符 重 载 。 在 
这 些 语言 中 ， 用 户 可 以 定义 指数 操作 符 ， 而 使 用 起 来 就 很 像 Perl 中 内 置 的 乘 备 操 作 符 。 关 于 用 
户 定义 的 操作 符 重 载 ， 将 在 第 9.10 节 中 讨论 。 

一 些 程序 设计 语言 ， 例 如 Fortran 和 Ada 语 言 ， 同 时 提供 了 函数 和 过 程 。 基 于 C 的 语言 则 只 具 
有 了 函数。 然而， 这 些 语言 中 函数 的 行为 却 与 过 程 相 类 似 。 也 可 以 定义 这 些 函 数 不 返 回 任何 值 ， 
只 要 将 它们 的 返回 类 型 定义 为 void。 因 为 在 这 些 语言 中 的 表达 式 也 可 以 被 用 作 语 句 ， 所 以 对 
void 类 型 的 函数 的 单独 调用 是 合法 的 。 例 如 ， 考 虑 下 面 的 函数 首部 及 其 调用 


void sort(int list[], int listlen); 


sort(scores, 100); 


Java、C++ 以 及 C# 中 的 方法 与 C 中 的 函数 相 类 似 。 
9.3 子 程序 的 设计 问题 
子 程序 是 程序 设计 语言 中 的 复杂 结构 ， 并 且 随 之 而 来 的 是 在 它们 的 设计 中 涉及 了 大 量 的 问 
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题 。 其 中 的 一 个 明显 问题 就 是 对 参数 传递 方法 的 选择 。 各 种 语言 所 使 用 的 各 种 不 同方 法 反映 了 
在 这 个 问题 上 不 同 的 意见 。 另 一 个 与 此 紧密 相关 的 问题 是 ， 是 否 应 该 按照 与 实 参 相对 应 的 形 参 
的 类 型 来 进行 实 参 类 型 的 类 型 检测 。 

子 程序 局 部 环境 的 性 质 在 某 种 程度 上 表现 了 这 个 子 程序 的 性 质 。 这 里 最 重要 的 问题 是 ， 局 
部 变量 是 被 静态 地 还 是 动态 地 实施 分 配 。 

下 面 的 一 个 问题 是 ， 是 否 允 许 子 程序 定义 的 嵌 套 。 还 有 一 个 问题 是 ， 是 否 可 以 将 子 程序 名 
作为 参数 来 传递 。 如 果 允 许 将 子 程序 名 作为 参数 来 传递 ， 而 且 这 种 语言 同时 允许 子 程序 的 幅 套 ， 
那么 对 于 一 个 作为 参数 来 传递 的 子 程序 ， 就 又 存在 着 一 个 正确 引用 环境 的 问题 。 

最 后 的 一 个 问题 是 子 程序 是 否 可 以 重 载 或 者 通用 化 。 重 载 的 子 程序 是 在 同一 种 引用 环境 中 ， 
与 男 一 个 子 程序 同名 的 子 程序 。 通 用 子 程序 则 是 指 该 子 程序 的 计算 可 以 通过 不 同 的 调用 在 不 同 
的 数据 类 型 上 进行 。 

下 面 是 对 这 些 子 程序 的 设计 问题 的 一 个 一 般 性 总 结 。 另 一 些 特别 与 函数 相关 联 的 问题 ， 将 
在 第 9.9 节 中 进行 讨论 。 

。 局 部 变量 是 静态 地 还 是 动态 地 被 绑 定 ? 

* 子 程序 的 定义 可 以 出 现在 其 他 子 程序 的 定义 之 中 吗 ? 

。 可 以 使 用 什么 样 的 参数 传递 方法 ? 

© 应 该 按照 形 参 的 类 型 来 对 实 参 类 型 进行 检测 吗 ? 

* 如 果 可 以 将 子 程序 作为 参数 传递 ， 并 且 子 程序 可 以 被 戏 套 ， 这 个 被 传递 的 子 程序 的 引用 

环境 将 是 什么 ? 

。 子 程序 可 以 重 载 吗 ? 

。 子 程序 可 以 通用 化 吗 ? 

关于 这 些 问 题 以 及 范例 设计 ， 将 在 下 一 节 中 讨论 。 


9.4 局 部 引用 环境 
本 让 讨论 在 子 程序 中 定义 的 变量 相关 的 问题 ， 还 简要 涵盖 了 和 仍 套子 程序 定义 的 问题 ， 
9.4.1 局 部 变量 


子 程序 可 以 定义 它们 自己 的 变量 ， 由 此 而 定义 局 部 引用 环境 。 定 义 于 子 程序 内 部 的 变量 被 
称 为 局 部 变量 ， 因 为 这 些 变 量 的 作用 域 通常 就 限定 于 定义 它们 的 子 程序 之 中 。 

在 第 5 章 中 的 术语 里 ， 局 部 变量 可 以 为 静态 的 ， 也 可 以 为 栈 动态 的 。 如 果 局 部 变量 是 栈 动态 
的 ， 当 子 程序 开始 执行 之 时 ， 这 些 变量 就 与 存储 空间 相 绑 定 ， 并 在 执行 终止 之 时 解除 这 种 绑 定 。 
栈 动态 的 局 部 变量 具有 很 多 优点 ， 其 中 的 主要 优点 是 它们 为 子 程序 提供 了 灵活 性 。 递 归 子 程序 
具有 栈 动态 的 局 部 变量 ， 这 是 十 分 关键 的 。 栈 动态 局 部 变量 的 另 一 个 优点 是 ， 在 活跃 子 程序 中 
的 局 部 变量 的 存储 空间 可 以 与 所 有 在 非 活跃 子 程序 中 的 局 部 变量 共享 。 当 然 ， 现 在 这 个 优点 已 
经 不 像 当 年 计算 机 只 有 很 小 的 存储 空间 时 那么 重要 了 。 

栈 动态 局 部 变量 的 主要 缺点 如 下 ; 首先 ， 对 于 子 程序 的 每 一 次 调用 ， 这 种 变量 所 需要 
的 存储 空间 分 配 、 初 始 化 〈 当 必要 时 ) 以 及 变量 解除 分 配 ， 都 有 时 间 上 的 代价 。 其 次 ， 对 
于 栈 动 态 局 部 变量 的 存 取 必 须 是 间接 的 ， 而 对 于 静态 变量 的 存 取 则 可 以 是 直接 的 。9 这 种 


O ”在 一 些 实现 中 ,静态 变量 也 可 以 间接 访问 到 ， 这 样 就 消除 这 个 缺点 。 


U 
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间接 性 之 所 以 必要 ， 是 因为 只 有 在 执行 期 间 才 能 确定 一 个 局 部 变量 在 栈 中 的 位 置 〈 见 第 10 
章 ) 。 在 大 多 数 计算 机 上 ， 间 接 寻 址 比 直接 寻 址 要 慢 。 最 后 一 点 ， 具 有 栈 动态 局 部 变量 的 子 
程序 不 是 历史 敏感 的 ， 也 就 是 说 ， 它 们 不 能 够 在 调用 之 间 保 持 局 部 变量 的 数据 值 。 能 够 编 
写 历史 敏感 的 子 程序 有 时 是 很 方便 的 。 需 要 历史 敏感 的 子 程序 的 一 个 例子 是 一 个 产生 伪 随 
机 数 的 子 程序 。 对 这 种 子 程序 的 每 一 次 调用 都 将 基于 这 个 子 程序 所 产生 的 最 后 一 个 伪 随 机 
数 ， 再 由 此 计算 新 的 伪 随 机 数 ， 因 此 必须 在 一 个 静态 局 部 变量 里 储存 这 个 最 后 的 随机 数 。 
协同 程序 以 及 用 于 迭代 循环 结构 的 子 程序 (曾经 在 第 8 章 讨 论 过 ) 是 需要 历史 敏感 的 子 程序 
HASAT. 

较 之 栈 动态 局 部 变量 ,静态 局 部 变量 所 具有 的 主要 优点 是 它们 的 高 效率 一 一 因为 没有 间 
接 性 ， 它 们 通常 可 以 被 很 快 地 存 取 。 此 外 ， 它 们 的 分 配 与 解除 分 配 也 没有 运行 时 的 额外 代 
价 。 当 然 还 有 一 点 ， 它 们 允许 历史 敏感 的 子 程序 。 静 态 局 部 变量 的 最 大 缺点 是 不 具有 支持 
递归 运算 的 能 力 。 另 外 ， 静 态 局 部 变量 的 存储 空间 不 能 够 与 其 他 非 活跃 子 程序 中 的 局 部 变 
量 共享 。 

在 大 多 数 的 当代 语言 中 ， 都 将 子 程序 中 的 局 部 变量 默认 为 栈 动态 的 。 在 C 和 C++ 的 函数 中 ， 
局 部 变量 一 般 都 是 栈 动态 的 ， 除 了 那些 被 特别 声明 为 static (静态 ) 的 变量 除外 。 例 如 ， 在 
下 面 的 C (RACH) 函数 中 ， 变 量 sum 是 静态 的 ， 而 变量 count 则 是 栈 动态 的 。 

int adder(int list[], int listlen) { 

static int sum = 0; 

int count; 

for (count = 0; count < listlen; count ++) 
sum += list [count]; 


return sum; 


} 


Ada 中 的 子 程序 仅 具 有 栈 动态 局 部 变量 。C++，Java 以 及 C# 中 的 方法 也 仅仅 具有 栈 动 态 局 部 
变量 。 

QTE BSP MDT, Fortran 95 的 实现 人 员 可 以 将 局 部 变量 选择 为 静态 的 还 是 栈 动态 的 。 
实际 上 ， 因 为 Fortran-90 之 前 的 Fortran 版 本 不 允许 递归 运算 ， 所 以 没有 理由 一 定 要 将 局 部 变量 
选择 为 栈 动态 的 。 一 般 人 们 认为 ,为 了 节省 存储 空间 而 损失 效率 是 不 值得 的 。 不 论 在 哪 种 实 
现 中 ，Fortran 95 的 用 户 都 可 以 通过 将 变量 名 列 于 一 条 Save 语 句 中 ， 从 而 将 一 个 或 多 个 局 部 变 
量 强制 为 静态 的 。 

在 Fortran 95 中 ， 可 以 显 式 地 将 一 个 子 程序 说 明 为 递归 的 ， 而 且 在 这 种 情形 下 ， 这 个 子 程序 
的 局 部 变量 则 是 栈 动 态 的 。 这 种 说 明 递 归 调 用 的 子 程序 的 思想 最 初 来 自 于 PLI 语言 。 显 式 说 明 
的 目的 是 为 了 允许 使 用 一 种 更 高 效 的 方式 来 实现 非 递 归 子 程序 。 下 面 是 一 个 递归 子 程序 框架 的 
例子 : 


Recursive Subroutine Sub () 
Integer :: Count 
Save, Real :: Sum 





End Subroutine Sub 


在 这 个 子 程序 中 ， 因 为 将 这 个 子 程序 定义 为 是 递归 的 ， 因 而 变量 Count 是 栈 动态 的 。 变 量 
Sum 是 静态 的 ， 因 为 它 被 标记 了 Save。 


0 


在 Python 中 ， 用 在 方法 定义 中 的 仅 有 的 声明 是 全 局 的 。 在 方法 中 任何 声明 为 全 局 的 变量 必 
须 是 在 方法 外 面 定义 的 变量 。 在 方法 外 面 定义 的 变量 不 需要 在 方法 内 声明 它 为 全 局 就 能 引用 它 。 
如 果 在 一 个 方法 中 对 全 局 变量 赋值 ， 该 变量 隐 式 声明 为 局 部 的 ， 赋 值 操作 也 会 影响 全 局 。 所 有 
Python 方法 的 局 部 变量 都 是 栈 动态 的 。 
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仍 套 子 程序 的 思想 起 源 于 Algol 60。 其 动机 是 能 创建 一 个 逻辑 和 作用 域 层次 。 如 果 一 个 子 程 
序 只 在 另 一 个 子 程序 内 需要 ， 为 什么 不 把 它 放 在 那里 ， 并 以 程序 的 剩余 部 分 隐藏 它 ? 因为 静态 
作用 域 常 常用 在 允许 子 程序 嵌 套 的 语言 中 ， 这 在 闭合 子 程序 中 也 为 访问 非 局 部 变量 提供 了 一 种 
高 度 结构 化 的 方法 。 回 顾 一 下 ， 这 里 引入 的 问题 在 第 5 章 中 的 讨论 。 长 期 以 来 ， 只 有 人 允许 内 套子 
程序 的 语言 是 从 Algol 60 衍 生 而 来 ， 包 括 Algol 68、Pascal 和 Ada。 许 多 其 他 语言 ， 包 括 所 有 C 的 
直接 衍生 语言 ， 都 不 允许 子 程序 舱 套 。 近 来 ， 一 些 新 语言 又 开始 允许 它 ， 其 中 有 JavaScript、 
Python 和 Ruby。 


9.5 参数 传递 方法 


参数 传递 方法 是 将 参数 传送 到 或 者 取 自 被 调用 子 程序 的 方式 。 首 先 ， 我 们 将 注意 力 集中 于 
参数 传递 方法 的 主要 语义 模式 上 ， 然 后 讨论 语言 的 设计 人 员 为 这 些 语义 模式 所 开发 的 各 种 实现 
模式 ， 接 下 来 再 审视 各 种 命令 式 语 言 的 设计 选择 ， 并 且 讨 论 用 于 实现 这 些 实现 模式 的 实际 方 
法 ;最 后 我 们 将 考虑 语言 设计 人 员 在 选择 这 些 方法 时 所 面临 的 一 种 设计 考虑 。 


9.5.1 参数 传递 的 语义 模式 


可 以 使 用 三 种 不 同 的 语义 模式 来 刻画 形 参 :(1) 它们 能 够 接受 来 自 与 其 相对 应 的 实 参 的 数 
据 ，(2) 它们 能 够 将 数据 传递 给 这 些 实 参 ，(3) 它们 能 够 施行 这 两 种 任务 。 我 们 将 这 三 种 语义 
模式 分 别称 为 输入 型 、 输 出 型 以 及 输入 输出 型 。 例 如 ， 考 虑 一 个 子 程序 ， 该 子 程序 取 int 类 型 
的 两 个 数组 来 作为 参数 ， 它 们 分 别 是 1ist1 和 1ist2。 这 个 子 程序 必须 将 list1 与 1ist2 相 加 ， 
并 且 将 返回 的 计算 结果 作为 1ist2 的 新 版 本 一 一 即 替换 了 原来 的 list2。 另 外 ， 该 子 程序 还 必 
须 使 用 这 两 个 已 给 的 数组 (进行 某 种 计算 ) 产生 出 一 个 新 的 数组 ， 并 且 返 回 这 个 新 的 数组 。 对 
于 这 个 子 程序 ， 数 组 1ist1 应 该 为 输入 型 的 ， 因 为 它 将 不 会 被 子 程序 改变 。 而 数组 1ist2 则 必 
须 是 输入 输出 型 的 ， 因 为 子 程序 将 需要 这 个 数组 的 初始 值 ， 而 且 还 必须 给 它 返 回 它 的 新 值 。 这 
里 的 第 三 个 数组 就 应 该 是 输出 型 的 ， 因 为 它 不 具有 初始 值 ， 而 且 还 必须 将 计算 的 新 值 返回 给 调 
用 程序 。 

大 于 在 参数 的 传递 中 怎样 进行 数据 的 传输 ， 有 两 种 概念 模式 : 将 实际 的 值 复制 (到 调用 程 
序 ， 到 被 调用 程序 ， 或 者 到 这 两 者 )， 或 者 通过 一 条 存 取 途径 来 传输 。 最 普通 的 方法 是 ， 存 取 途 
径 就 是 一 个 简单 的 指针 或 者 一 个 简单 的 引用 。 图 9-1 说 明 当 使 用 值 的 复制 方式 时 ， 参 数 传递 的 三 
种 语义 模式 。 
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调用 程序 被 调用 程序 
(sub (a, b, c)) 调用 (void sub (int x, int y, int 2z)) 





图 9-1 当 使 用 数值 物理 移动 的 方式 时 ， 参 数 传递 的 三 种 语义 模式 





第 二 部 分 : 脚本 语言 的 一 般 性 与 Perl 语 言 的 特殊 性 

LARRY WALL 

Larry Wall 经 历 丰富 ， 他 涉足 于 书籍 出 版 、 语 言 出 版 、 软 件 出 版 以 及 儿童 教育 
(他 有 四 个 孩子 ) 。 他 曾 在 Seattle Pacific University (西雅图 太平 详 大 学 ) Berkeley 
(伯克利 ) 以 及 UCLA (加 州 大 学 洛杉矶 分 校 ) been 他 还 曾经 在 Unisys 公 司 、Jet 
a Propulsion Laboratories 以 及 Seagate 公 司 工 作 过 。 给 他 带 来 最 大 名 气 的 是 语言 出 版 
(“ 却 只 有 最 少 的 金钱 回报 ”Larry 补 充 道 ): Larry 是 Perl 脚 本 语言 的 作者 。 

脚本 语言 的 一 些 特点 

A): 关于 脚本 语言 的 定义 是 什么 ? 

E: 人 们 经 常 在 争论 脚本 语言 与 程序 设计 语言 之 间 的 差别 。 如 果 你 问 我 这 个 问题 ， 我 会 告诉 你 : 脚 
本 是 给 演员 的 ， 而 程序 是 给 观众 的 。 我 的 意思 是 : 脚本 是 正在 通过 作者 、 导 演 和 演员 而 逐渐 成 形 的 东西 ， 
而 程序 则 是 相对 固定 的 一 系列 预先 决定 的 事件 。 

在 脚本 与 程序 之 间 并 没有 截然 的 差别 。 脚 本 也 可 以 演变 为 程序 。 如 果 使 用 我 们 的 比喻 : 当 你 正在 编 
写 一 个 程序 ， 它 就 像 是 一 个 脚本 ， 而 当 你 完成 了 一 个 脚本 ， 它 就 更 像 是 一 个 程序 了 。 

有 一 些 语言 能 够 让 你 比较 容易 即兴 地 写 出 一 段 东 西 ， 应 该 将 这 些 语言 归 为 脚本 语言 。 而 另外 的 一 些 
语言 ， 则 能 够 让 你 比较 容易 地 对 数据 结构 进行 精确 而 又 高 效 的 处 理 。 当 然 ， 你 必须 首先 说 明 很 多 东西 。 应 
该 将 这 些 语 言 归 为 程序 设计 语言 。 人 们 通常 将 Perl 归 类 于 脚本 语言 。 但 这 只 是 一 种 过 于 简单 化 的 分 类 ， 或 
者 称 为 去 复杂 化 的 分 类 。 

m: 你 认为 读者 应 该 怎样 理解 脚本 语言 ? 

丛 ， 节 重要 的 事情 是 : 当 人 们 常常 打算 将 一 个 样机 程序 扔 掉 时 ， 他 们 事实 上 并 没有 这 么 做 。 他 们 本 
来 只 是 打算 使 用 这 个 代码 一 次 ， 却 因为 它 “ 足 够 好 ” 而 将 它 留 下 来 ， 导 致 这 些 代码 在 软件 生产 中 使 用 的 
时 间 比 当初 的 期 望 长 得 多 。 

关于 Perl 语 言 的 更 多 方面 以 及 Perl 的 发 展 历程 

IF]; Perl 与 其 他 脚本 语言 有 什么 区 别 ? 

E: 我 认为 一 种 好 的 脚本 语言 应 该 能 够 允许 你 将 你 的 脚本 进化 为 “真正 ”的 程序 。Perl 就 能 够 提供 这 
个 方面 的 全 面 支持 。 换 言 之 ，Perl 是 一 种 能 够 随 着 你 的 需求 而 不 断 “ 长 大 ” 的 语言 。 
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脚本 就 像 是 通 往 高 速 公 路 的 加 速 道 。 大 多 数 的 语言 只 是 试图 提供 加 速 道 而 没有 高 速 公路 ， 或 者 是 只 
提供 高 速 公路 而 没有 加 速 道 。Perl 则 提供 这 两 者 。 这 就 是 为 什么 Perl 的 口号 是 :“ 条 条 道路 通 罗 马 ”。Perl 并 
不 给 你 强加 任何 特定 的 方式 。 有 一 些 问题 最 好 是 使 用 管道 和 模式 匹配 技术 来 解决 ， 而 其 他 的 一 些 问题 则 最 
好 是 使 用 函数 式 程序 设计 、 事 件 驱 动 的 程序 设计 或 者 面向 对 象 的 程序 设计 来 解决 。 

与 此 相反 ， 其 他 的 一 些 语言 企图 将 你 套 在 一 种 特定 的 思维 方式 中 ， 或 者 是 使 得 与 外 部 的 交互 困难 重 
重 。Perl 并 不 是 想 要 成 为 一 种 完美 的 语言 ， 它 只 是 要 成 为 一 种 有 用 的 、 能 够 方便 地 与 其 他 语言 和 系统 合作 
的 语言 。 自 然 语 言 不 是 乌托邦 ， 它 们 不 禁 固 思想 。 计 算 机 语言 也 不 应 该 禁 固 人 的 思想 。 

问 : 当 你 创建 Perl 语 言 时 ， 你 想象 过 它 能 够 成 为 今天 的 这 个 样子 吗 ? 是 什么 使 得 Perl 成 为 网 络 上 有 用 
的 工具 ? 市 场 是 非常 重要 的 。 在 你 看 来 ， 工 业界 和 计算 机 界 做 了 些 什么 ， 使 得 Perl 腾 飞 起 来 ? 

答 : 是 的 。 我 知道 Perl 会 很 大 ， 但 没有 料 到 它 会 这 么 大 。 最 初 ， 我 发 现在 文本 处 理 方面 ，Perl 会 将 awk 
和 sed 淘 汰 ; 在 与 任意 的 接口 连接 方面 ， 会 令 shell 程 序 设 计 成 为 过 时 的 东西 。 一 旦 我 将 所 有 的 系统 管理 操作 
增加 进去 ， 我 相信 大 多 数 的 UNIX 系 统管 理 人 员 将 会 选择 Perl 作 为 程序 设计 语言 ， 这 是 不 足 为 怪 的 。 

真正 使 我 吃惊 的 是 ， 万 维 网 以 及 很 大 部 分 的 万 维 网 程序 会 使 用 Perl 来 编写 。HTTP 是 一 种 基于 文本 的 
Pri; 万 维 网 服务 器 需要 某 种 粘 合 代码 来 进行 文本 与 末端 数据 库 之 间 的 翻译 转换 。Perl 正 好 是 在 正确 的 时 
刻 出 现在 正确 的 位 置 、 具 有 正确 功能 的 语言 。 

这 恰恰 印证 了 另 一 个 事实 : 一 个 好 的 工具 被 用 于 它 的 创造 者 都 没有 想象 到 的 地 方 。 然 而 这 并 不 完全 
仅仅 是 一 种 意外 。 一 个 优秀 的 创造 人 员 会 将 优良 的 功能 加 入 到 一 种 产品 中 。 当 机 会 出 现时 ， 这 些 功 能 就 派 
上 了 用 场 。 

lA): 你 最 喜欢 Perl 语 言 中 的 哪个 部 分 ? 

答 : 我 最 喜欢 的 是 亲手 修改 我 所 最 不 喜欢 的 东西 。 认 真 地 说 ， 我 最 喜欢 的 是 保留 在 Perl 6 中 的 部 分 。 
Perl 总 是 十 分 有 利于 演化 ， 以 及 在 Perl 环 境 中 能 够 与 其 他 程序 及 语言 很 好 地 合作 。 在 这 些 方面 ，Perl 只 能 会 
继续 变 得 更 好 。Perl 在 快速 样机 设计 以 及 文本 处 理 方面 将 继续 保持 优秀 。 它 还 将 具有 更 好 的 模式 匹配 功能 
(所 有 的 这 些 ， 都 是 假设 我 们 能 够 完成 Perl 6 的 话 …… )。 

lA): 作为 结束 语 ， 如 果 你 不 是 在 进行 你 目前 所 做 的 这 一 切 ， 你 会 怎样 打发 你 的 时 间 ? 

答 : 很 可 能 会 让 我 周围 的 人 疡 狂 …… 


9.5.2 参数 传递 的 实现 模式 


语言 的 设计 人 员 开 发 了 各 种 模式 ， 来 指导 如 何 实现 三 种 基本 的 参数 传递 模式 。 在 下 面 的 几 
节 里 ， 我 们 将 讨论 其 中 的 几 种 模式 ， 并 且 评 佑 它们 各 目的 相对 长 处 与 弱点 。 

9.5.2.1 按 值 传递 

当 参 数 是 按 值 传递 时 ， 实 参 的 值 将 被 用 来 为 与 其 相对 应 的 形 参 设 定 初 值 ， 然 后 这 个 形 参 的 
行为 就 像 是 子 程序 中 的 局 部 变量 ， 并 由 此 实现 了 输入 型 的 语义 。 

通常 将 按 值 传递 实现 为 数据 的 复制 ， 因 为 采用 这 种 方法 通常 具有 较 高 的 存 取 效率 。 也 可 以 
通过 传输 一 条 通 往 调 用 程序 中 实 参 的 值 的 存 取 途 径 来 实现 ， 但 这 种 方式 要 求 数值 是 在 一 个 受 写 
入 保护 的 单位 ( 即 只 读 单位 ) 中 。 强 制 写 入 保护 并 不 总 是 一 件 简 单 的 事情 。 例 如 ， 设 想 一 个 接 
受 被 传递 参数 的 子 程序 ， 而 它 又 将 这 个 参数 传递 给 男 一 个 子 程序 。 这 就 正 是 使 用 复制 传递 的 另 
一 个 理由 。 我 们 将 在 9.5.4 市 中 看 到 ，C++ 提 供 了 一 种 方便 而 有 效 的 方法 ， 对 于 以 存 取 路 径 方 式 
传递 的 按 值 传递 的 参数 进行 强制 写 入 保护 。 

按 值 传递 的 优点 是 对 于 标量 来 说 ， 它 是 快速 的 ， 链 接 开 销 小 和 存储 时 间 。 

使 用 数据 复制 方式 的 按 值 传递 方法 的 主要 缺点 是 需要 给 形 参 以 额外 的 存储 空间 ， 或 者 是 在 
调用 程序 中 ， 或 者 是 在 调用 程序 以 及 被 调用 子 程序 以 外 的 某 个 区 域 中 。 除 此 之 外 ， 还 必须 将 实 
参 复制 到 与 之 相对 应 的 形 参 的 存储 区 域 中 。 如 果 一 个 参数 很 大 的 话 (例如 包含 很 多 元 素 的 数组 )， 
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这 些 存 储 空间 以 及 这 种 复制 操作 可 能 就 具有 很 高 的 代价 。 

9.5.2.2 按 结果 传递 

按 结果 传递 是 用 于 输出 型 参数 的 一 种 实现 模式 。 当 一 个 参数 被 按 结果 传递 时 ， 并 没有 将 值 
传递 到 子 程序 。 相 对 应 的 形 参 的 行为 就 如 同一 个 局 部 变量 ， 但 是 在 将 控制 返回 到 调用 程序 之 前 ， 
形 参 值 被 传递 给 调用 程序 的 实 参 ， 显 然 ， 这 个 实 参 必 须 是 一 个 变量 。( 如 果 这 个 实 参 是 一 个 字面 
前 量 或 者 一 个 表达 式 ， 调 用 程序 怎么 能 够 引用 计算 结果 呢 ? ) 

按 结 条 传递 方法 有 按 值 传递 的 优点 和 缺点 ， 再 加 上 一 些 额 外 的 缺点 。 如 果 这 些 值 如 同 平 常 
那样 是 经 复制 返回 (而 不 是 经 存 取 路 径 )， 按 结果 传递 也 会 需要 额外 的 存储 空间 和 复制 操作 ， 就 
如 同 按 值 传递 一 样 。 通 过 传输 存 取 途径 来 实现 按 结果 传递 ， 同 样 是 十 分 困难 的 ， 这 也 如 同 在 按 
值 传递 时 的 情形 一 样 ， 因 而 这 也 就 导致 通常 将 按 结 果 传 递 实现 为 数据 复制 。 在 这 种 情况 下 ， 要 
确保 被 调用 的 子 程序 不 能 够 使 用 实 参 的 初始 值 。 

按 结 采 传递 模式 中 的 一 个 额外 的 问题 是 可 能 会 出 现实 参 冲突 ， 如 下 面 的 这 个 调用 : 


sub(pl, pl) 


假设 在 sub 中 ,这 两 个 形 参 具 有 不 同 的 名 字 ， 那 么 显然 可 以 给 这 两 个 形 参 赋 以 不 同 的 值 。 
而 无 论 将 其 中 的 哪 一 个 最 后 复制 给 它们 对 应 的 实 参 ， 都 将 成 为 p1 的 值 ， 因 而 实 参 复制 的 次 
序 就 决定 了 它们 的 值 。 例 如 ， 考 虑 下 面 的 C# 方 法 ， 它 指定 了 在 其 形 参 上 带 有 out 指 示 符 的 按 


结 采 传递 方法 。” 


void Fixer(out int x, out int Y) 4 
x = 17; 
y = 35; 


} 


f.Fixer(out a, out a); 

如 朱 在 Fixer 执 行 的 末尾 ， 形 参 x 首 先 赋值 给 其 对 应 的 实 参 ， 在 调用 函数 中 实 参 a 的 值 将 是 
35。 如 未 首先 赋值 y， 调 用 函数 中 实 参 a 的 值 为 17。 | 

因为 次 序 有 时 依赖 于 具体 语言 的 实现 ， 不 同 的 实现 能 产生 不 同 的 结果 。 

第 9.5.2.4 市 将 要 讨论 到 ， 当 使 用 其 他 的 参数 传递 方法 ， 在 调用 一 个 过 程 时 使 用 两 个 相同 的 
实 参 也 可 能 引起 不 同类 型 的 问题 。 | 

使 用 按 结果 传递 的 方式 可 能 出 现 的 另 一 个 问题 是 实现 人 员 可 以 选择 在 两 个 不 同时 刻 对 实 参 
的 地 址 求 值 : 即 在 调用 时 ， 或 在 返回 时 。 例 如 ， 考 虑 下 面 C# 方 法 和 下 面 的 代码 ; 


void DoIt(out int x, int index){ 
x = 17; 
index = 42; 
} 
RE = 21; 
f.DoIt(list[sub], sub); 
list[ sub] 的 地 址 在 方法 开始 和 结束 之 间 变 化 。 实 现 者 必须 在 调用 时 或 返回 时 选择 决定 的 
返回 值 地 址 的 时 间 。 如 果 在 方法 入 口 处 计算 地 址 ， 值 17 将 返回 给 1ist[21]; 如果 正好 在 返回 
前 计算 ，17 将 返回 给 1ist[42]。 这 使 程序 在 子 程序 开始 时 为 出 模式 参数 选择 求 值 地 址 和 结束 


时 选择 求 值 地 址 的 实现 之 间 是 不 可 移植 的 。 


O ”out 指 示 符 也 必须 在 对 应 的 实 参 上 指定 。 
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9.5.2.3 按 值 与 结果 传递 

按 值 与 结果 传递 是 对 输入 输出 型 参数 的 一 种 实现 模式 ， 在 这 种 模式 中 ， 实 际 的 值 被 复制 。 
它 在 效果 上 是 按 值 传递 和 按 结 果 传递 的 结合 。 使 用 实 参 值 来 为 其 对 应 的 形 参 设 定 初 值 ， 此 后 ， 
这 个 形 参 即 具 有 局 部 变量 的 行为 。 事 实 上 ， 按 值 与 结果 传递 中 的 形 参 必须 具有 与 被 调用 子 程序 
相关 联 的 局 部 存储 空间 。 在 子 程序 终止 时 ， 形 参 值 被 传递 回 实 参 。 

有 时 ， 按 值 与 结果 传递 被 称 为 按 复制 传递 ， 因 为 实 参 在 子 程序 的 入 口 被 复制 给 形 参 ， 然 后 
在 子 程序 终止 时 又 被 复制 回来 。 

按 值 与 结果 传递 具有 与 按 值 传 递 以 及 按 结果 传递 这 两 者 共同 的 缺点 ， 需要 给 参数 提供 额外 
的 存储 空间 以 及 数值 复制 的 时 间 。 它 也 与 按 结果 传递 具有 共同 的 实 参 赋值 次 序 问题 ， 

按 值 与 结果 传递 的 优点 是 与 按 引 用 传递 相关 的 ， 因 此 它们 将 在 第 9.5.2 节 中 讨论 。 

9.5.2.4 按 引 用 传递 | 

按 引 用 传递 是 对 输入 输出 型 参数 的 第 二 种 实现 模式 。 按 引用 传递 的 方式 不 像 按 值 与 结果 伟 
递 那 样 ， 将 数据 值 来 回 地 复制 ， 按 引用 传递 的 方式 是 给 被 调用 子 程序 传递 一 条 存 取 途径 ， 通 党 
就 古 一 个 地 址 。 这 给 被 调用 子 程序 提供 了 对 实 参 存储 单位 的 存 取 途 径 。 因 此 允许 被 调用 子 程序 
从 调用 程序 单位 中 存 取 实 参 。 在 实际 效果 上 ， 被 调用 子 程序 就 共享 了 这 个 实 参 。 

按 引 用 传递 方式 的 优点 是 ， 这 种 传递 过 程 的 本 身 在 时 间 与 空间 两 方面 都 具有 高 效率 。 不 需 
要 复 份 的 存储 空间 ， 也 不 需要 任何 复制 的 过 程 。 

然而 ， 按 引用 传递 方法 也 具有 几 种 缺点 。 第 一 ， 对 形 参 的 存 取 速 度 将 较 按 值 传递 的 方式 慢 ， 
因为 需要 额外 层次 的 间接 寻 址 。9 第 二 ， 如 果 只 要 求 对 被 调用 子 程序 的 单 向 传递 ， 可 能 会 在 实 
参 上 产生 一 些 不 易 察 觉 但 是 错误 的 改变 。 

按 引 用 传递 的 另 一 个 严重 问题 是 可 能 产生 别名 使 用 。 因 为 按 引 用 传递 使 得 被 调用 子 程序 可 
以 使 用 存 取 途 径 ， 并 由 此 扩展 它们 对 非 局 部 变量 的 访问 ， 所 以 别名 使 用 应 该 是 在 预料 之 中 。 当 
按 引 用 传递 参数 时 ， 有 几 种 产生 别名 的 方式 。 在 其 他 环境 中 ， 这 些 别 名 使 用 的 问题 是 相同 的 ， 
它 对 可 读 性 和 可 靠 性 是 有 害 的 。 它 也 使 程序 验证 变 得 极端 困难 。 

现在 我 们 讨论 一 些 按 引 用 传递 参数 能 创建 别名 的 方法 。 首 先 ， 在 实 参 之 间 可 能 产生 一 些 串 
突 。 考 虑 一 个 C++ 中 的 函数 ， 它 具有 两 个 将 按 引 用 传递 的 参数 (参见 9.5.3 节 )， 如 


void fun(int &first, int &second) 


如 采 对 fun 的 调用 恰巧 两 次 都 传递 了 同一 个 变量 ， 如 

fun(total, total) 

那么 ， 在 fun 中 的 first 与 second; 会 是 别名 。 

其 次 ， 在 数组 元 素 之 间 的 冲突 也 会 引起 别名 。 例 如 ， 设 想 函 数 fun 是 通过 由 变量 下 标 说 明 
的 两 个 数组 元 素 被 调用 ， 如 

fun(list[i], list[{j]) 

如 有 这 两 个 参数 是 按 引用 传递 的 ， 并 且 i 恰好 就 等 于 j， 那 么 ， first 和 second 又 一 次 成 
为 了 别名 。 

最 后 ， 如 果 一 个 子 程序 的 两 个 形 参 ， 一 个 为 数组 元 素 ， 而 另 一 个 为 整个 数组 ， 而 这 两 个 参 
数 都 是 按 引 用 传递 的 ， 那 么 下 面 这 样 的 一 个 调用 : 


funl(list[i], list) 


日 ”这 将 在 第 9.5.3 节 中 深入 讨论 。 
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就 可 以 导致 函数 fun1 中 的 别名 使 用 ， 因 为 fun1 可 以 通过 它 的 第 二 个 参数 来 访问 1ist 中 的 
所 有 元 素 ， 通 过 它 的 第 一 个 参数 来 访问 一 个 单一 元 素 。 

运用 按 引用 传递 的 参数 还 有 另 一 种 引起 别名 使 用 的 方式 ， 即 形 参 与 可 见 的 非 局 部 变量 之 间 
的 冲突 。 例 如 ， 考 虑 下 面 的 C 代 码 : 

int * global; 

void main() { 

select eels 

} 
void sub(int * param) { 

} 

在 sub 中 ，param 和 global 即 为 别名 。 

如 琳 是 使 用 按 值 与 结果 传递 ， 而 不 是 按 引 用 传递 的 话 ， 所 有 这 些 可 能 的 别名 使 用 问题 都 不 
会 存在 。 然 而 ， 当 没有 别名 使 用 问题 时 ， 有 了 时 又 会 出 现 如 9.5.2.3 节 中 讨论 的 其 他 一 些 问 题 。 

95.2.5 按 名 传递 

按 名 传递 是 一 种 输入 输出 型 参数 的 传递 方法 ， 它 不 对 应 于 单个 的 实现 模式 。 当 参数 是 按 名 
传递 时 ， 对 于 子 程序 中 的 所 有 情形 ， 实 参 实际 上 都 以 文本 形式 替代 了 与 它 相 对 应 的 形 参 。 这 与 
迄今 为 止 讨 论 过 的 方法 相当 不 同 。 在 前 面 的 情况 下 ， 形 参 在 子 程序 调用 时 被 绑 定 于 实际 的 值 或 
者 地 址 。 而 一 个 按 名 传递 的 形 参 ， 是 在 子 程序 调用 时 被 绑 定 于 一 种 存 取 方 法 ， 而 这 个 形 参 对 于 
值 或 者 对 于 地 址 的 实际 绑 定 ， 则 被 推迟 到 对 形 参 赋值 或 者 形 参 被 引用 以 后 。 

因为 按 名 传递 方法 不 是 任何 广泛 应 用 的 语言 中 的 部 分 ， 所 以 我 们 不 会 进一步 对 它 进行 讨论 。 
然而 ， 这 种 方法 却 被 宏 用 于 汇编 语言 的 编译 时 ， 以 及 C++ 和 Ada 中 的 通用 子 程序 的 通用 参数 ， 
9.8 证 将 要 讨论 这 些 内 容 。 


9.5.3 实现 参数 传递 的 方法 


我 们 现在 来 讨论 如 何 实际 地 实现 参数 传递 的 各 种 实现 模式 。 

在 大 多 数 当代 语言 中 ， 参 数 间 的 交流 是 通过 运行 时 栈 而 发 生 的 。 对 于 运行 时 栈 进行 初始 化 
和 维护 ， 都 是 由 管理 程序 执行 的 系统 程序 ， 即 运行 时 系统 来 执行 的 。 正 如 我 们 将 在 第 10 章 讨论 
的 ， 在 子 程序 的 控制 链接 过 程 以 及 子 程序 的 参数 传递 过 程 中 ， 都 极 大 量 地 使 用 了 运行 时 栈 。 在 
下 面 的 讨论 中 ， 我 们 假定 所 有 的 参数 传递 过 程 都 使 用 运行 时 栈 。 

按 值 传递 的 参数 ， 它 们 的 值 被 复制 到 栈 中 的 位 置 。 栈 中 的 这 个 位 置 接着 就 成 为 相对 应 的 形 
参 的 存储 空间 。 实 现 按 结果 传递 参数 方式 正好 与 按 值 传递 参数 方式 相反 。 赋 给 按 结果 传递 中 的 
实 参 的 值 将 被 放置 到 栈 里 ， 在 被 调用 子 程序 结束 以 前 ， 调 用 程序 都 可 以 查询 这 些 实 参 的 值 。 按 
值 与 结果 传递 的 参数 可 以 根据 它们 的 语义 直接 实现 ， 它 们 是 按 值 传递 方式 与 按 结果 传递 方式 的 
结合 。 由 调用 程序 来 实施 参数 栈 空间 的 初始 化 ， 然 后 ， 它 们 的 使 用 就 如 同 被 调用 子 程序 中 的 局 
部 变量 。 

按 引 用 传递 的 参数 也 许 是 实现 起 来 最 简单 的 一 种 方式 。 不 论 实 参 的 类 型 如 何 ， 仅 仅 必须 将 
实 参 的 地 址 放 入 栈 空间 。 对 于 字面 常量 ， 是 将 字面 常量 地 址 放 入 栈 空间 。 而 如 果 是 表达 式 ， 编 
译 禹 则 必须 在 控制 转移 到 被 调用 子 程序 之 前 ， 产 生出 表达 式 求 值 的 代码 ， 而 将 存放 这 个 代码 求 
值 结果 的 存储 单位 的 地 址 放 入 栈 中 。 编 译 器 还 必须 确保 被 调用 的 子 程序 不 会 改变 参数 ， 而 无 论 
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这 些 参数 是 字面 常量 还 是 表达 式 。 存 取 被 调用 子 程序 中 的 形 参 是 通过 栈 中 的 地 址 来 间接 寻 址 。 
图 9-2 显 示 了 使 用 运行 时 栈 来 实现 的 按 值 传递 、 按 结果 传递 、 按 值 与 结果 传递 以 及 按 引用 传递 参 ， 
数 的 方式 。 从 主 程序 main 中 调用 子 程序 sub， 调 用 形式 为 sub(w， x, y, z)。 其 中 的 参数 w 
是 按 值 传递 的 ，x 是 按 结果 传递 的 ，y 是 按 值 与 结果 传递 的 ， 而 z 是 按 引 用 传递 的 。 

程序 main 栈 函数 sub 





图 9-2 几 种 常见 参数 传递 方法 的 一 种 可 能 的 栈 实现 


如 朱 是 使 用 按 引 用 传递 以 及 按 值 与 结果 传递 参数 的 方式 ， 但 在 实现 这 些 方式 时 没有 特别 小 
心 ， 将 产生 一 个 微妙 但 却 致命 的 错误 。 假 设 ， 一 个 程序 包括 了 两 个 对 常量 10 的 引用 ， 第 一 个 
征 作 为 对 子 程序 进行 调用 中 的 实 参 。 如 果 进 一 步 地 再 假设 ， 于 程序 错误 地 改变 了 与 10 相 对 应 
的 形 参 的 值 ， 将 10 改 变 成 5， 正 如 编译 器 通常 所 做 的 那样 ， 程序 的 编译 器 可 能 会 在 编译 时 为 数 
值 10 建 立 单个 的 存储 位 置 ， 并 且 将 这 个 位 置 用 于 程序 中 所 有 对 数值 10 的 引用 但 是 自 子 程序 
返回 之 后 ， 所 有 后 续 的 对 于 数值 10 的 引用 实际 上 都 成 为 了 对 数值 5 的 引用 如 末 人 允许 这 种 情形 
发 生 的 话 ， 就 会 产生 一 个 很 难 诊断 的 程序 设计 问题 。 这 种 情形 在 Fortran IV 的 许多 实现 之 中 的 


9.5.4 主要 语言 中 的 参数 传递 方法 

C 使 用 指针 来 作为 参数 ， 进 而 满足 了 按 值 传递 以 及 按 引 
用 传递 (输入 输出 型 ) 的 语义 。 将 指针 的 值 传 给 被 调用 也 neon 
数 ， 但 并 不 返回 任何 数值 。 然 而 ， 因 为 所 传递 的 是 对 于 调 OA 
用 函数 数据 的 存 取 途径 ， 所 以 被 调用 函数 就 可 以 改变 调用 ih i | TER 
函数 中 的 数据 。C 语 言 是 从 ALGOL 68 复 制 了 这 种 按 值 传递 po 
的 方法 。 在 C 与 C++ 中， 形 参 可 以 为 指向 常量 的 指针 类 型 ， POBA, Aae etA 
它 所 对 应 的 实 参 不 必 是 常量 ， 因 为 在 这 种 情况 下 会 将 这 些 。 补 语 来 流行 的 ALGOL 60 的 任何 后 
实 参 强制 为 常量 。 这 样 ， 指 针 参数 被 多 许 通过 使 用 单 向 按 。 继 语 言 所 继承 ， 除 了 SIMULA67 
值 传递 的 语义 来 提供 按 引用 传递 的 效率 。 在 被 调用 函数 中 “之 外 
参数 的 写 保 护 是 隐 式 的 。 

第 6 章 中 讨论 过 ，C++ 包 括 了 一 个 特殊 指针 类 型 ， 称 为 引用 类 型 ， 它 常常 被 用 于 参数 。 引 用 
参数 是 在 函数 中 或 者 在 方法 中 被 隐 式 间接 引用 ， 它 们 的 语义 则 是 按 引用 传递 。C++ 也 介 许 将 引 
用 参数 定义 为 常量 。 例 如 ， 我 们 可 以 有 
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void fun(const int &pl, int p2, int &p3) { ... } 

在 这 里 ，p1 是 按 引 用 传递 的 ， 但 是 不 能 够 在 函数 fun 中 被 改变 ， 参 数 P2 是 按 值 传 递 的 ， 而 
p3 是 按 引 用 传递 的 。 在 函数 fun 中 ，p1 以 及 p3 都 不 需要 被 显 式 间接 引用 。 
常量 参数 与 输入 型 参数 并 不 完全 一 样 。 十 分 显然 的 是 ， 

a a A 常量 参数 实现 了 输入 型 参数 。 然 而 ， 在 除了 Ada 之 外 的 所 有 
ea ee EE 常用 的 命令 式 语言 中 ， 可 以 在 子 程序 中 给 输入 型 参数 赋值 ， 
Mut nee EB PRIX HEAR MEA RIREES EMV RB SE. w 
递 方法 ， 来 替代 低 效 率 的 按 名 传 量 参数 则 不 能 够 被 赋值 、 
nit ey 人 如 同 在 C 和 C++ 中 一 样 ，Java 中 的 所 有 参数 都 是 按 值 传 

递 的 。 然 而 ， 因 为 对 象 只 能 够 通过 引用 变量 来 存 取 ， 对 象 参 

数 实 际 上 只 能 够 按 引 用 传递 。 同 样 ， 因 为 引用 变量 不 能 够 直接 指 癌 标量 变量 ， 加 上 Java 中 不 存在 
指针 ， 因 而 在 Java 中 ， 标 量 不 能 够 按 引 用 传递 〈 一 个 包含 标量 的 对 象 却 能 够 按 引 用 传递 ) 。 

Ada 的 设计 人 员 定 义 了 参数 传递 的 三 种 语义 模式 版 本 : 输入 型 、 输 出 型 以 及 输入 输出 型 。 
这 三 种 模式 分 别 用 保留 字 in、out 和 in out 来 表示 ， 其 中 的 in 为 默认 方法 。 例 如 ， 考 虑 下 面 
的 Ada 子 程序 的 首部 : 


procedure Adder(A : in out Integer; 
B : in Integer; 
C : out Float) 
在 Ada 中 被 声明 为 out 模 式 的 形 参 可 以 被 赋值 ， 但 是 却 不 可 以 引用 。in 模 式 的 参数 则 可 以 
引用 ， 但 是 不 可 以 被 赋值 。 目 然 ， 在 Ada 中 :in out 模 式 的 参数 既 可 以 被 引用 又 可 以 被 赋值 。 
在 Ada 95 中 ， 所 有 标量 都 是 通过 复制 来 传递 ， 而 所 有 的 结构 参数 则 是 通过 引用 来 传递 。 
Fortran 95 十 分 类 似 于 Ada， 通 过 使 用 它 的 Intent 属 性 ， 可 以 将 它 的 形 参 声 明 为 输入 、 输 出 
或 者 输入 输出 型 。 例 如 ， 考 虑 下 面 Fortran 95 子 程序 的 首部 : 
Subroutine Adder(A, B, C) 
Integer, Intent(Inout) :: A 
integer, Intent(In) :: B 
Integer, Intent(Out) :: C 
这 个 子 程序 中 参数 的 语义 模式 与 前 面 的 Ada 子 程序 中 相同 。 
C# 中 默认 的 参数 传递 方法 是 按 值 传递 。 可 以 通过 特殊 的 说 明 来 使 用 按 引用 传递 需要 在 形 
参 以 及 对 应 的 实 参 前 面 都 放置 说 明 符 ref。 例 如 ， 考 虑 下 面 C# 中 的 方法 和 调用 框架 : 


void sumer(ref int oldSum, int newOne) { ... } 


sumer(ref sum, newValue); 


传递 给 sumez 的 第 一 个 参数 是 按 引用 传递 的 ;而 第 二 个 参数 则 是 按 值 传递 的 。 

C# 还 支持 输出 型 的 参数 ， 这 是 一 些 按 引 用 传递 的 不 需要 初始 值 的 参数 。 这 类 参数 是 用 out 
修饰 符 在 形 参 表 中 说 明 。 

C# 中 的 方法 可 以 获取 不 同 数目 的 参数 ， 只 要 这 些 参 数 具 有 相同 的 类 型 。 在 方法 中 只 定义 一 
个 参数 ， 即 一 个 具有 修饰 符 params 的 数组 。 例 如 ， 

void SumInts (params int [] intValues) { ... } 

这 个 方法 可 以 被 一 个 数组 或 者 一 列 整数 表达 式 来 调用 。 例 如 ， 


int [] myIntArray = new int[6] {2, 4, 6, 8, 10, 12}; 
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suml = SumInts(myIntArray) ; 
sum2 = SumInts(10, i, 17, k); 


PHP 中 的 参数 传递 类 似 于 C# 中 的 参数 传递 ， 但 PHP 可 以 将 形 参 或 者 实 参 的 传递 说 明 为 按 引 
用 传递 。 这 种 说 明 是 通过 在 两 个 参数 中 的 一 种 或 者 两 种 之 前 放置 & 符 号 。 

Perl 语 言 采用 了 传递 参数 的 一 种 原始 形式 。 它 将 所 有 (所 有 一 切 !) 的 实 参 都 隐 式 地 放置 在 
一 个 名 为 @_ 的 预定 义 数组 中 。 这 个 数组 可 以 装载 任何 类 型 的 数据 ， 子 程序 从 这 个 数组 中 获取 实 
参 的 值 (或 者 地 址 )。 这 个 数组 最 特殊 的 方面 是 它 所 具有 的 神奇 特性 ， 即 它 的 元 素 事实 上 就 是 实 
参 的 别名 。 因 而 ， 如 采 被 调用 的 子 程序 改变 了 e_ 中 的 一 个 元 素 ， 这 种 改变 将 反映 到 调用 中 的 实 
参 之 上 。 在 这 里 ， 我 们 假设 这 个 子 程序 调用 具有 相应 的 实 参 ( 实 参 的 数目 与 形 参 的 数目 并 不 一 
定 相 同 ) ， 而 且 这 个 实 参 是 一 个 变量 。 

Fython 和 Ruby 的 参数 传递 方式 称 为 按 赋值 传递 。 因 为 所 有 的 数据 值 都 是 对 象 ， 所 以 每 个 变 
量 都 是 对 对 象 的 引用 。 在 按 赋值 传递 中 ， 实 参 值 赋值 给 形 参 . 因此 ， 因 为 所 有 实 参 值 都 是 引用 ， 
所 以 按 赋值 传递 实际 上 是 按 引 用 传递 。 然 而 ， 这 只 会 在 某 些 情况 下 产生 按 引用 传递 参数 传递 语 
义 。 例 如 ， 许 多 对 象 基本 上 是 不 变 的 。 在 纯 面 向 对 象 的 语言 中 ， 改 变 赋 值 语句 中 变量 值 的 过 程 ， 
如 下 


x = x + 1 


并 不 改变 x 引 用 的 对 象 。 而 采用 这 种 方式 : 它 在 x 引 用 的 对 象 上 加 1 从 而 创建 一 个 新 的 对 
R (具有 x+1 的 值 )， 然 后 改变 x 以 引用 新 的 对 象 。 因 此 ， 当 把 对 标量 对 象 的 引用 传递 给 子 程 序 
时 ， 引 用 的 对 象 不 能 在 适当 的 地 方 改变 。 因 为 引用 是 按 值 传递 的 ， 所 以 尽管 形 参 在 子 程序 中 改 
变 ， 这 个 改变 对 调用 者 的 实 参 没有 影响 。 

现在 ， 假 设 对 数组 的 引用 作为 参数 传递 。 如 采 把 对 应 的 形 参 赋值 给 新 的 数组 对 象 ， 那 么 它 
对 调用 者 没有 影响 。 然 而 ， 如 果 形 参 用 于 赋值 给 数组 元 素 ， 如 下 


list[3] = 47 
实 参 就 改变 了 。 因 此 ， 虽然 改变 形 参 的 引用 对 调用 者 没有 影响 ， 但 是 改变 作为 参数 传递 的 
数组 元 素 却 会 对 调用 者 产生 影响 。 


9.5.5 参数 类 型 检测 


现在 人 们 广泛 地 接受 了 这 样 一 种 观念 ， 即 软 件 可 靠 性 要 求 进行 实 参 的 类 型 检测 ， 以 便 与 对 
应 的 形 参 类 型 相 一 致 。 如 果 没 有 这 种 类 型 检测 ， 小 的 打 字 错 误 就 可 能 导致 难以 诊断 的 程序 错误 ， 
因为 编译 器 或 者 运行 时 系统 不 能 够 发 现 这 种 错误 。 例 如 ， 在 下 面 的 函数 调用 中 


result = subl(1) 


而 又 疫 有 要 求 。 

CS 和 C++ 在 参数 类 型 检测 的 问题 上 需要 进行 一 些 特殊 的 讨论 ， 早期 的 C 无 论 是 对 参数 的 数目 
还 古 类 型 都 不 进行 检测 。 在 C89 中 ， 函数 的 形 参 可 以 用 两 种 方式 来 定义 。 第 一 种 方式 与 早期 的 C 
中 的 定义 相同 ， 也 就 是 将 参数 名 列 在 括号 之 内 ， 而 参数 的 类 型 声明 跟随 在 后 ， 如 
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double sin(x) 
double x; 


ET 
使 用 这 种 方法 避免 了 类 型 检测 ， 因 而 如 下 的 调用 : 


double value; 
int count; 


dae = sin(count); 
古 合 法 的 ， 尽 管 它 并 不 是 正确 的 。 | 
为 一 种 方法 是 被 称 为 原型 (prototype) 的 方法 ， 这 种 方法 将 形 参 类 型 也 包括 进 参数 表 ， 如 


double sin(double x) 


ee 

使 用 与 上 面相 同 的 函数 调用 来 调用 sin 的 这 个 版 本 ， 即 

value = sin(count); 

这 也 是 合法 的 。 对 照 形 参 类 型 (double) ， 对 实 参 的 类 型 (int) 进行 检测 。 虽 然 它们 并 
不 匹配 ， 但 是 可 以 将 int 类 型 强制 转换 为 double 类 型 ( 宽 化 强制 转换 ) ， 从 此 完成 类 型 的 转换 。 
如 朱 这 种 转换 不 可 能 〈 例 如 ， 如 果实 参 是 一 个 数组 ) ， 或 者 参数 的 数目 是 错误 的 ， 则 会 检查 出 一 
个 语法 错误 。 因 而 在 C89 中 ， 用 户 可 以 选择 是 否 需要 进行 类 型 的 检测 。 

在 C99 以 及 C++ 中 ， 所 有 的 函数 所 具有 的 形 参 都 必须 在 它 的 原型 形式 中 。 然 而 ， 通 过 使 用 省 
略 纪 来 替代 参数 表 中 的 最 后 部 分 ， 就 可 以 避免 对 某 些 参数 的 类 型 检测 ， 如 下 面 所 示 ; 


int printf(const char* format_string, ...); 


一 个 对 于 Printf 的 调用 至 少 必 须 包括 一 个 参数 ， 这 个 参数 是 一 个 指向 常量 字符 串 的 指针 。 
除 此 以 外 ， 任 何 东 西 〈 或 者 什么 也 没有 ) 都 是 合法 的 。printf 用 来 确定 是 否 存在 额外 参数 的 
方式 是 通过 字符 串 参 数 中 所 出 现 的 特殊 符号 。 例 如 ， 一 个 整数 输出 的 格式 代码 为 sd。 它 作为 字 
符 串 部 分 出 现 ， 如 下 面 所 示 


printf("The sum is %d\n", sum); 


这 里 的 符号 % 通 知 函 数 printf 后 面 还 有 一 个 参数 。 

当 基 本 类 型 能 按 引 用 传递 时 (如 在 C# 中 )， 有 一 个 更 有 趣 的 关于 实 参 向 形 参 强制 转换 的 问 
题 。 假 设 对 一 个 方法 的 引用 传递 fl10at 值 给 double 型 形 参 。 如 果 访 参数 按 值 传递 ， 那 么 
float 值 会 强制 转换 为 double 值 ， 而 没有 任何 问题 。 特 定 的 强制 转换 是 非常 有 用 的 ， 因 为 它 


qouble 型 实 参 的 值 返回 给 调用 者 的 Eloat 型 实 参 时 ， 该 值 将 发 生 溢出 。 为 了 避免 这 种 问题 的 
产生 ，C# 需 要 精确 匹配 对 应 形 参 的 ref 实 参 的 类 型 (不 允许 强制 转换 ) 。 

Python 和 Ruby 没 有 参数 类 型 检查 ， 原 因 是 在 这 些 语言 中 的 类 型 化 是 一 个 不 同 的 概念 。 对 象 
有 类 型 ， 但 变量 却 没有 ， 因 此 形 参 是 没有 类 型 的 。 类 型 检查 参数 的 思想 在 这 里 不 适用 ，。 


9.5.6 多 维 数组 作为 参数 


我 们 曾经 在 第 6 章 用 较 长 篇 幅 讨论 过 将 多 维 数组 元 素 引 用 中 的 下 标 值 映射 到 存储 空间 地 址 的 
存储 映射 函数 。 在 一 些 语言 中 , 如 C 和 C++， 当 将 一 个 多 维 数组 作为 参数 来 传递 给 一 个 子 程序 时 ， 
编译 避 在 只 看 见 子 程序 的 文本 时 (而 不 是 看 见 调 用 程序 时 ) 必须 能 够 为 这 个 数组 建立 映射 函数 
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之 所 以 会 如 此 ， 是 因为 子 程序 与 调用 它们 的 程序 可 以 被 分 开 编 译 。 考 虑 在 C 中 将 一 个 矩阵 传递 
给 一 个 函数 的 问题 。 在 C 中 ， 多 维 数组 实际 上 是 数组 的 数组 ， 并 且 是 以 按 行 存放 的 方法 存储 。 
下 面 是 一 个 按 行 存 放 和 矩阵 的 映射 函数 ， 这 个 矩阵 下 限 的 下 标 都 为 0， 并 且 元 素 的 大 小 是 1; 


address(mat[i, j]) =address(mat[0,0]) +i * number_of_columns + j 


注意 ， 这 个 映射 函数 需要 和 矩阵 的 列 数 ， 但 不 需要 行 数 。 历史 注释 





上 


因而 在 C 和 C++ 中 ， 当 将 一 个 矩阵 作为 参数 来 传递 时 ， 形 参 
必须 将 列 数 包括 在 它 的 第 二 对 括号 中 。 这 在 下 面 的 C 程 序 杠 
架 中 进行 了 说 明 : 
void fun(int matrix[][10]) { 
oe : 
void main() { 
int mat[5][10]; 
ae 
} 
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写 一 个 图 数 ， 它 可 以 接受 不 同 列 数 的 矩阵 ， 而 对 于 每 一 个 
具有 不 同 列 数 的 和 矩阵， 都 需要 编写 一 个 新 的 函数 。 这 在 实 


Ada 83 语 言 的 定义 说 明 ， 标 
È ( 非 结构 的 ) 参数 是 按 复制 传递 
的 ; 也 就 是 输入 型 和 输入 输出 型 的 
参数 是 局 部 变量 ， 它 们 通过 复制 对 
应 的 实 参 值 而 被 初始 化 。 当 子 程序 
终止 时 ， 输出 型 或 者 输入 输出 型 的 
简单 参数 值 被 复制 回 相 对 应 的 实 参 
之 上 。 当 存在 着 多 次 复制 时 ， 复 制 
的 次 序 不 是 由 语言 的 定义 来 指定 
的 。 输 出 型 和 输入 输出 型 的 参数 求 
值 是 在 控制 转移 到 被 调用 子 程序 之 
前 发 生 的 。 例 如 ， 假 设 一 个 输出 型 
的 实 参 具有 下 面 的 形式 : 


际 上 是 不 允许 编写 可 以 有 效 地 重复 使 用 的 灵活 函数 来 用 于 
处 理 多 维 数组 。 在 C 和 C++ 中 ， 因 为 包括 了 指针 算术 ， 因 而 存在 一 种 方式 来 绕 过 这 种 问题 ， 可 以 
将 矩阵 作为 指针 来 传递 ， 并 将 矩阵 的 实际 维 数 作为 参数 包括 进来 。 然 后 当 每 一 次 引用 矩阵 中 的 
一 个 元 素 时 ， 这 个 函数 可 以 使 用 指针 算术 来 计算 用 户 编写 的 存储 映射 函数 。 例 如 ， 考 虑 下 面 的 
图 数 原型 : 

void fun(float *mat ptr, 

int num_rows, int num cols); 
可 以 使 用 下 面 的 语句 将 变量 x 的 值 赋 给 fun 中 的 参数 矩阵 的 元 素 [zow] [col]; 


*(mat_ptr + (row * num cols) + 
col) = x; 


虽然 能 够 完成 这 种 计算 ,但 显然 很 难以 阅读 ， 并 且 因 为 所 具有 的 复杂 性 ， 十 分 容易 产生 错 
误 。 可 以 通过 使 用 一 条 宏 指 令 定 义 存 储 映射 函数 ， 以 减轻 阅读 方面 的 困难 ， 如 


#define mat_ptr(r,c) 
(*mat ptr + ((r) * (num cols) + (c))) 


使 用 这 一 条 定义 ， 上 面 的 赋值 语句 就 可 以 写成 为 


mat _ptr(row,col) = x; 


其 他 的 语言 以 不 同方 式 来 处 理 多 维 数组 传递 的 问题 。Ada 的 编译 器 能 够 在 编译 子 程序 时 ， 
确定 所 有 作为 参数 使 用 的 数组 的 定义 维 长 。 在 Ada 中 ， 不 受 限制 的 数组 类 型 可 以 为 形 参 。 不 受 
限制 的 数组 类 型 是 在 数组 类 型 的 定义 中 没有 给 出 下 标 范围 。 但 在 不 受 限制 数组 类 型 的 变量 定义 
中 则 必须 包括 下 标 范围 。 传 递 一 个 不 受 限制 数组 的 子 程序 代码 ， 可 以 获得 与 这 个 参数 相关 的 实 
参 的 下 标 范 围 信息 。 例 如 ， 考 虑 下 面 的 定义 : 
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历史 注释 


list[index] 

在 调用 时 将 计算 这 个 参数 的 
地 址 值 。， 如 果 1list 的 “index” 恰 巧 
在 被 调用 子 程序 中 为 可 见 的 ， 并且 
这 个 子 程 序 对 它 还 进行 了 修改 ， 然 
而 这 个 参数 地 址 将 不 会 受到 影响 。 

当 形 参 是 数组 或 者 记录 时 ， 
Ada 83 的 实现 人 员 可 以 在 按 值 与 
结果 传递 与 按 引 用 传递 之 间 进 行 
选择 。 如 果 Ada 83 的 设计 人 员 没 
有 说 明 传 递 结构 化 参数 的 实现 方 
法 ， 将 可 能 产生 一 种 微妙 的 问题 。 
这 个 问题 就 是 ， 这 两 种 实现 方法 
可 能 会 导致 某 些 程序 产生 不 同 的 
程序 结果 。 之 所 以 会 出 现 这 种 不 
同 的 结果 ， 是 因为 按 引 用 传递 的 
方法 提供 了 对 调用 程序 中 一 个 存 
储 单 元 的 访问 ; 但 如 果实 参 为 全 
局 可 见 的 ， 就 提供 对 这 个 存储 单 
元 的 另 一 种 访问 ， 这 样 就 产生 了 
别名 。 如 果 是 使 用 按 值 与 结果 传 
弟 来 代替 按 引 用 传递 ， 这 种 对 实 
参 的 双重 访问 则 是 不 可 能 的 。 

另 一 个 问题 如 下 所 述 : 假如 
子 程 序 非 正常 地 结束 (由 异常 引 
起 ) ， 在 按 值 与 结果 传递 实现 中 的 
实 参 将 不 会 被 改变 ， 而 在 按 引 用 
传递 的 实现 中 ， 则 可 能 甚至 在 错 
误 出 现 之 前 就 已 经 改变 了 相对 应 
的 实 参 。 再 一 次 地 说 明 ， 这 两 种 
实现 方法 之 间 可 能 存在 着 不 同 。 

如 果 一 个 Ada 83 程 序 根 据 实 
现 输入 输出 方法 的 不 同 将 产生 不 同 
的 结果 ; 这 个 程序 就 被 称 为 有 误 的 
(erroneous) 。 编 译 器 不 能 够 检测 出 
这 种 锚 误 。 通 常 是 当 用 户 将 程序 从 
一 种 实现 转移 到 另 一 种 实现 ， 并 意 
识 到 它 将 产生 不 同 结果 时 ， 才 能 够 
发 现 这 种 错误 。 对 于 这 种 问题 ， 
Ada 83 设计 的 哲学 是 ， 编 程 人 员 
必须 确保 能 够 防止 别名 的 出 现 ， 如 
果 他 们 创建 了 别名 ， 他 们 必须 与 这 
种 潜在 的 问题 进行 “斗争 ”。 


type Mat Type is array (Integer range <>, 
Integer range <>) of 
Float; 


Mat 1 : Mat Type(1..100, 1..20); 


一 个 函数 将 返回 Mat_Type 类 型 的 数组 中 元 素 的 总 和 ， 
这 个 国 数 的 形式 如 下 : 
function Sumer(Mat : 
is 
Sum : Float := 0.0; 
begin 
for Row in Mat’range(1) loop 
for Col in Mat’range(2) loop 
Sum := Sum + Mat(Row, Col); 
end loop; -- 结束 列 的 循环 … 
end loop; -- 结束 行 的 循环 … 
return Sum; 
end Sumer; 


这 里 的 属性 range 返 回 给 定 下 标的 实 参 数组 的 下 标 范 
围 ， 因 此 不 论 参 数 的 下 标 范 围 大 小 如 何 ， 总 是 能 够 完成 这 
项 任务 。 

在 Fortran 中 ， 这 种 问题 是 以 下 面 的 方式 来 解决 的 。 必 
须 在 图 数 首部 之 后 声明 数组 类 型 的 形 参 。 对 于 一 维 数组 ， 
声明 中 的 下 标 是 无 关 紧 要 的 ， 但 是 对 于 多 维 数组 ， 这 种 声 
明 中 的 下 标 能 够 使 编译 器 产生 存储 映射 函数 。 考 虑 下 面 示 
例 的 Fortran 子 程序 的 框架 : 


in Mat Type) return Float 


Subroutine Sub(Matrix, Rows, Cols, Result) 
Integer, Intent(In) :: Rows, Cols 
Real, Dimension(Rows, Cols), Intent(In) :: 
Real, Intent(In) :: Result 


Matrix 


End Subroutine Sub 


只 要 实 参 Rows 具 有 被 传递 矩阵 的 定义 中 行 数 的 值 ， 这 
个 子 程序 就 能 够 工作 。 如 果 在 目前 ， 被 传递 数组 中 并 没有 
将 所 定义 的 范围 都 装 满 有 用 的 数据 ， 那 么 ， 可 以 将 所 定义 
的 数组 下 标 范 围 以 及 已 经 填充 部 分 的 下 标 范围 都 传递 给 子 
程序 。 然 后 ， 这 种 定义 的 范围 被 用 于 数组 的 局 部 声明 中 ， 
而 已 经 填充 部 分 的 下 标 范围 则 被 用 来 控制 数组 元 素 引 用 的 
计算 。 例 如 ， 考 虑 下 面 的 Fortran 子 程序 : 

Subroutine Matsum(Matrix, Rows, Cols, Filled Rows, 

Filled Cols, Sum) 


Real, Dimension(Rows, Cols), Intent(In) :: 
Integer, Intent(In) :: 


Matrix 
Rows, Cols, Filled Rows, 
Filled Cols 

Real, Intent(Out) :: Sum 

Integer :: Row_Index, Col Index 

Sum = 0.0 

Do Row Index = 1, Filled Rows 
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Do Col_Index = 1, Filled Cols 
Sum = Sum + Matrix(Row Index, Col Index) 
End Do 
End Do 
End Subroutine Matsum 


Java 和 C# 使 用 一 种 与 Ada 类 似 的 技术 ， 将 多 维 数组 作为 参数 来 传递 。 在 Java 和 C# 中 数组 是 
对 象 ， 对 象 都 是 一 维 的 。 但 是 这 些 对 象 的 元 素 也 可 以 是 数组 。 每 一 个 数组 都 继承 了 一 个 命名 常 
量 (在 Java 中 为 length， 在 C# 中 为 Length) ， 当 创建 数组 对 象 时 ， 将 命名 常量 length 或 
Length 设 置 为 数组 的 维 长 。 和 矩阵 的 形 参与 两 对 空 的 方 括 号 同时 出 现 ， 如 同 下 面 Java 中 的 方法 所 
ARs 这 个 方法 与 前 面 的 Ada 示 例 函 数 Sumer 具 有 相同 的 功能 . 


float sumer( float mat[][]) { 
float sum = 0.0f; 
for (int row = 0; row < mat.length; IOow++) { 
for (int col = 0; col < mat[row].length; col++) { 
sum += mat[row][col]; 
} //** for (int row... 
$} s**t for (int Col sis 
return sum; 


} 
因为 每 一 个 数组 都 具有 自己 的 长 度 值 ， 所 以 ， 和 矩阵 中 的 行 可 以 具有 不 同 的 长 度 。 


9.5.7 设计 考虑 


在 选择 参数 传递 的 方法 时 ， 应 该 考虑 涉及 的 两 个 重要 方面 ， 效率 以 及 是 否 需要 进行 单 向 还 
是 双向 的 数据 传递 。 

当代 软件 工程 的 原则 明确 指出 ， 应 该 将 通过 子 程序 代码 来 存 取 子 程序 之 外 数据 的 可 能 性 减 
到 最 小 。 基 于 这 种 原则 ， 只 要 是 不 需要 通过 参数 将 数据 返回 调用 程序 时 ， 束 应 该 使 用 输入 型 的 
参数 。 而 当 不 需要 将 数据 传递 到 被 调用 子 程序 ， 但 子 程序 必须 返回 数据 到 调用 程序 时 ， 就 应 该 
使 用 输出 型 的 参数 。 最 后 ， 从 有 当 数 据 必 须 在 调用 子 程序 与 被 调用 子 程序 之 间 双 向 传递 时 ， 才 
使 用 输入 输出 型 参数 。 

一 种 实际 原因 引起 与 上 述 原 则 的 冲突 。 有 时 ， 进 行 单 向 的 参数 传输 时 、 传递 一 条 存 取 路 径 
是 合适 的 。 例 如 ， 要 将 一 个 大 的 数组 传递 给 一 个 并 不 修改 数组 的 子 程序 时 ， 选用 单 向 方法 可 能 
更 合适 一 些 。 如 果 是 按 值 传递 的 话 ， 需要 将 整个 数组 传递 到 子 程序 的 局 部 存储 区 域 ， 这 在 时 间 
与 空间 两 个 方面 都 是 高 代价 的 。 因 为 这 个 原因 ， 对 大 的 数组 通常 是 按 引用 传递 。 这 恰恰 是 为 什 
么 在 Ada 83 语 言 定义 中 允许 实现 人 员 为 结构 化 参数 在 两 种 方法 之 间 进 行 选择 的 原因 C++ 中 的 
背 量 引用 参数 提供 了 另 一 种 解决 方案 。 还 有 一 种 方法 允许 用 户 在 这 些 方法 中 进行 选择 。 

关于 函数 的 参数 传递 方法 的 选择 ， 则 与 另 一 个 设计 问题 相关 即 消 数 的 副作用 。 这 个 问题 
将 在 9.9 节 中 进行 讨论 。 


9.5.8 参数 传递 的 例子 
考虑 下 面 的 C 函 数 : 


void swapl(int a, int b) { 
int temp = a; 
a = b; 
b = temp; 

} 


tx 


人 


P 


人 
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假设 使 用 下 面 的 语句 来 调用 这 个 函数 : 


Swapl(c, d); 


前 面 讲 过 C 是 使 用 按 值 传递 的 。 可 以 使 用 下 面 的 伪 码 来 描述 swap1 的 行为 : 


a = C 一 移 人 第 一 个 参数 的 值 

b= ¢ 一 移入 第 二 个 参数 的 值 

temp = 

a = b 

b = temp 

虽然 a 最 后 具有 qd 的 值 ，b 最 后 上 共有 c 的 值 ， 但 是 因为 没有 数据 返回 到 调用 程序 ， 所 以 c 和 qd 
的 值 没 有 发 生变 化 。 


我 们 可 以 修改 C 的 交换 函数 ， 以 便 能 够 使 用 指针 参数 达到 按 引 用 传递 的 效果 : 


void swap2(int *a, int *b) { 
int temp = *a; 
*a = *b; 
*b = temp; 

} 


可 以 使 用 下 面 的 语句 来 调用 swap2 : 
Swap2(&c, &d); 

可 以 以 下 面 的 形式 来 描述 swap2 的 行为 : 
a = &c 一 移 人 第 一 个 参数 的 地 址 

b = &d 一 移 人 第 二 个 参数 的 地 址 

temp = *a 

*a = *b 

*b = temp 
在 这 种 情况 下 交换 操作 是 成 功 的 : 事实 上 ， 值 c 与 qd 相互 交换 了 。 

还 可 以 使 用 C++ 中 的 引用 参数 来 编写 swap2， 如 下 所 示 : 

void swap2(int &a, int &b) { 

int temp = a; 
a b; 
b temp; 

} 

这 种 简单 的 交换 操作 在 Java 中 却 是 不 可 能 的 ， 因 为 Java 中 既 没 有 指针 ， 也 没有 C++ 中 的 这 种 
引用 。Java 中 的 引用 变量 只 能 够 指向 对 象 ， 而 不 能 够 指向 标量 值 。 

按 值 与 结果 传递 的 语义 与 按 引用 传递 的 相同 ， 除 非 是 涉及 别名 使 用 的 情形 。 前 面 说 过 ， 在 
Ada 中 对 输入 输出 型 的 标量 参数 使 用 的 是 按 值 与 结果 传递 。 为 了 更 深入 地 探究 按 值 与 结果 传递 
的 方式 ， 考 虑 下 面 的 函数 swap3， 我 们 假设 这 个 函数 使 用 按 值 与 结果 传递 的 参数 。 这 个 函数 是 
使 用 一 种 类 似 于 Ada 语 言 的 语法 来 编写 的 。 

procedure swap3(a : in out Integer, b : in out Integer) is 

temp : Integer; 
begin 

temp := a; 

a := b; 

b := temp; 

end swap3; 
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假设 可 以 使 用 下 面 的 语句 来 调用 swap3 : 


Swap3(c, d); 


在 这 种 调用 之 下 ，swap3 的 行为 是 : 


addr c = &c 一 移入 第 一 个 参数 的 地 址 
addr d = &d 一 移入 第 二 个 参数 的 地 址 
a = *addr c 一 移入 第 一 个 参数 的 值 
b = *addr d 一 移入 第 二 个 参数 的 值 
temp =a 

S.= 7h 

b = temp 

*addr c = a 一 移出 第 一 个 参数 的 值 
*addr_d = b 一 移出 第 二 个 参数 的 值 


因而 ， 这 个 交换 子 程序 的 操作 也 是 正确 的 。 下 面 来 考虑 这 个 调用 


Swap3(1, list[i]); 


在 这 种 情况 下 ， 它 的 行为 是 : 


addr i = &i 一 移入 第 一 个 参数 的 地 址 
addr listi = &list[i] 一 移入 第 二 个 参数 的 地 址 
a = *addr i 一 移入 第 一 个 参数 的 值 
b = taddr listi 一 移入 第 二 个 参数 的 值 
temp = a 

a=b 

b = temp 

*addr i = a 一 移出 第 一 个 参数 的 值 
*addr_listi = b 一 移出 第 二 个 参数 的 值 


下 次 ， 这 个 子 程序 的 操作 也 是 正确 的 ， 因 为 在 这 种 情形 下 对 返回 参数 值 的 地 址 的 计算 进行 

于 函数 调用 之 时 ， 而 不 是 返回 时 。 如 果 是 在 返回 时 才 计 算 实 参 的 地 址 ， 就 会 产生 错误 的 结果 417 
最 后 ， 我 们 必须 研究 当 使 用 按 值 与 结果 传递 以 及 按 引用 传递 时 ， 如 果 涉 及 了 别名 使 用 ， 将 

发 生 什么 情况 。 考 虑 下 面 用 类 似 C 的 语法 编写 的 程序 框架 


int i= 3; /* i 是 一 个 全 局 变量 */ 
void fun(int a, int b) { 
i = b; 
} 
void main() { 
int listi 101: 
list[i] = 5; 
fun(i, listi]: 


} 
ATES Eun EAS APB, MI GABA. AUB SERIE, i Sal 
不 定 别 名 。 假 设 是 按 值 与 结果 传递 ， 那 么 fun 的 行为 是 : 418 
addr i = &i 一 移 人 第 一 个 参数 的 地 址 
addr_listi = &list[i] 一 移入 第 二 个 参数 的 地 址 
a = *addr_i 一 移 人 第 一 个 参数 的 值 
b = *addr_listi 一 移入 第 二 个 参数 的 值 
E D 一 将 i 设置 为 5 
*addr i = a 一 移出 第 一 个 参数 的 值 


*addr listi = þ 一 移出 第 二 个 参数 的 值 
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在 这 种 情况 下 ， 在 函数 fun 中 对 全 局 变量 i 赋 值 ， 将 会 把 它 的 值 从 3 变 成 5， 但 是 从 第 一 个 
形 参 复制 回来 时 (上面 行为 说 明 中 的 倒数 第 二 行 )， 又 将 它 设置 回 3。 这 里 的 一 个 重要 发 现 就 是 ， 
如 果 是 使 用 按 引 用 传递 ， 结 果 导 致 所 复制 回来 的 值 并 不 是 语义 中 的 部 分 ， 并 且 i 仍 将 保持 为 5。 
另外 也 请 注意 ， 因 为 是 在 函数 fun 开 始 时 计算 第 二 个 参数 的 地 址 ， 全 局 变量 i 的 任何 改变 都 不 会 
影响 到 在 程序 的 尾 端 用 于 返回 list[i] 值 的 地 址 。 


96 子 程 序 名 作为 参数 


如 采 可 以 将 子 程序 的 名 称 作 为 参数 传递 给 其 他 子 程序 的 话 ， 就 可 以 极为 方便 地 处 理 程序 设 
计 中 产生 的 许多 情形 。 其 中 一 种 最 常见 的 情形 出 现 于 ， 当 子 程序 必须 进行 一 些 数学 函数 的 抽样 
上 时。 例如， 一 个 数值 积分 子 程序 在 估算 一 个 函数 图 形 下 面 的 面积 时 ， 它 通过 对 函数 在 许多 不 同 
的 点 抽取 样 值 来 进行 这 项 工作 。 所 编写 的 这 个 子 程序 应 该 可 以 被 用 于 任何 给 出 的 函数 ， 而 不 应 
该 对 每 一 个 需要 积分 的 函数 都 重新 编写 程序 。 因 而 十 分 自然 地 ， 应 该 可 以 将 需要 进行 积分 计算 
的 程序 函数 名 称 作 为 参数 传递 给 积分 子 程序 。 

虽然 这 种 思想 十 分 目 然 ， 而 且 看 上 去 也 相当 简单 ， 但 是 其 中 如 何 工作 的 细节 却 使 人 困惑 。 
如 采 只 是 需要 传递 子 程序 的 代码 ， 则 可 以 通过 传递 单个 指针 来 实现 ， 然 而 ， 却 有 两 种 复杂 的 
情形 。 

首先 ， 作 为 参数 传递 的 那个 子 程序 的 启动 参数 有 类 型 检测 的 问题 。 不 能 够 将 C 和 C++ 中 的 函 
数 作为 参数 来 传递 ， 但 是 指向 函数 的 指针 却 可 以 。 一 个 指向 函数 的 指针 的 类 型 就 是 这 个 函数 的 
协议 。 因 为 协议 之 中 包括 了 所 有 的 参数 类 型 ， 完 全 可 以 对 这 些 参 数 进行 类 型 检测 。Fortran 95 具 
有 一 种 机 制 来 对 作为 参数 传递 的 子 程序 提供 参数 类 型 的 检测 ， 而 且 必 须 对 这 些 参 数 进行 检测 。 
Ada 不 允许 将 子 程序 作为 参数 来 传递 。Ada 所 提供 的 通用 功能 代替 了 将 子 程 序 作为 参数 传递 的 功 
能 ， 关 于 这 些 ， 我 们 将 在 9.8 市 中 进行 讨论 。 

第 二 个 带 有 子 程序 作为 参数 的 应 用 只 出 现在 允许 垦 套 子 程序 的 语言 中 。 这 个 问题 即 是 ， 执 
行 被 传递 的 子 程序 时 ， 应 该 使 用 什么 样 的 引用 环境 。 这 里 存在 以 下 三 种 选择 : 

1. 局 动 被 传递 子 程序 的 调用 语句 的 环境 〈 浅 绑 定 )。 

2. 被 传递 子 程序 的 定义 环境 ORRE). 

3. 将 子 程序 作为 实 参 传递 的 调用 语句 的 环境 (特别 绑 定 ) 。 


历史 注释 下 面 用 JavaScript 语 法 编写 的 示例 程序 对 这 些 选 择 进行 





A 


Pascal 中 的 原始 定义 (Jensen 了 解释 。 
) i function Subl() { 
and Wirth, 1974) 允许 作为 参数 ae R 


传递 的 子 程序 不 包括 参数 类 型 的 
人 信息。 如果 独立 编译 是 可 能 的 
(在 初始 Pascal 中 没有 包括 独立 编 
译 )， 编 译 器 甚至 允许 不 检测 参数 
的 数目 正确 与 否 。 在 没有 独立 编 
译 的 情况 下 ,检测 参数 的 一 致 性 
是 可 能 的 ， 但 却 是 一 件 极为 复杂 
的 工作 ， 因 而 通常 并 不 施行 。 
Fortran 77 中 也 有 着 同样 的 问题 ， 
但 是 因为 Fortran 77 从 来 也 不 检 
测 和 参数 类 型 的 一 致 性 ， 因 而 这 并 
不 是 一 个 额外 的 问题 。 


function sub2() { 
alert(x); // 用 x 的 值 产生 一 个 对 话 框 
}; 
function sub3() { 
var x; 
x = 3; 
sub4(sub2); 
}; 
function sub4(subx) { 
var x; 
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sub3(); 
}; 

考虑 当 在 sub4 中 调用 sub2 时 sub2 的 执行 情况 。 对 于 浅 绑 定 ， sub2 的 执行 引用 环境 就 是 
sub4 的 执行 引用 环境 ， 因 而 将 在 sub2 中 对 x 的 引用 绑 定 于 sub4 中 的 局 部 变量 x， 而 且 程 序 的 输 
出 为 x=4。 对 于 深 绑 定 ，sub2 的 执行 引用 环境 就 是 sub1 的 引用 环境 ， 因而 将 在 sub2 中 对 x 的 
引用 绑 定 于 sub1l 中 的 局 部 变量 x， 而 且 程序 的 输出 为 x=1。 对 于 特别 绑 定 ， 这 种 绑 定 是 将 sub2 
中 对 于 x 的 引用 绑 定 到 sub3 中 局 部 变量 x 之 上 ， 并 且 其 输出 为 x=3， 

住 一 些 情况 下 ， 一 个 声明 子 程序 的 子 程序 也 可 以 将 被 声明 的 子 程序 作为 参数 来 传递 。 在 这 
种 情况 下 ， 深 绑 定 与 特别 绑 定 是 相同 的 。 特 别 绑 定 从 来 没有 被 使 用 过 ， 因为 人 们 可 能 会 猜测 ， 
作为 参数 的 程序 所 出 现 的 环境 与 被 传递 的 子 程序 并 没有 自然 的 联系 。 

戌 绑 定 不 适合 于 具有 伏 套 子 程序 的 静态 作用 域 语 言 。 例 如 ， 假设 程序 Sender 将 程序 Sent 
作为 参数 传递 给 程序 Receiver。 这 里 的 问题 是 ， Receiver 可 能 不 在 Sent 的 静态 环境 之 中 ， 
这 使 得 Sent 存 取 Receiver 中 的 变量 非常 不 自然 。 另 一 方面 ， 对 于 任何 一 种 静态 作用 域 语言 中 
的 子 程序 ， 包 括 被 作为 参数 传递 的 子 程序 ， 通过 子 程序 定义 中 的 词法 位 置 来 确定 它 的 引用 环境 
是 完全 正常 的 。 所 以 这 些 语言 使 用 深 绑 定 更 合乎 逻辑 ， 一 些 动态 作用 域 的 语言 则 使 用 浅 绑 定 。 


9.7 重 载 子 程序 


重 载 的 操作 符 是 具有 多 种 意义 的 操作 符 。 重 载 操作 符 的 某 一 个 特定 实例 由 它 的 操作 数 类 型 
决定 。 例 如 ， 如 果 在 一 个 Java 程 序 中 的 * 操 作 符 具有 两 个 浮 点 操作 数 ， 这 个 操作 符 所 说 明 的 就 是 
浮 氮 数 乘 法 。 但 是 如 果 同 样 的 * 操 作 符 具 有 两 个 整数 操作 数 ， 则 说 明 的 是 整数 乘法 。 

重 载 子 程序 是 与 另 一 个 在 相同 引用 环境 中 的 子 程序 具有 相同 名 称 的 子 程序 . 每 一 个 重 载 子 
程序 的 版 本 必须 只 具有 一 个 协议 ， 也 就 是 说 ， 它 必 须 与 子 程序 的 其 他 版 本 在 参数 的 数目 、 参 数 
的 顺序 或 者 参数 的 类 型 上 不 相同 ， 如 果 它 是 一 个 函数 的 话 ， 则 是 返回 的 类 型 不 相同 。 通 过 实 参 
表 来 决定 (或 者 ， 如 果子 程序 是 函数 的 话 ， 则 由 返回 值 的 类 型 来 决定 ) 重 载 子 程序 调用 的 意义 。 
尽管 它 是 不 必要 的 ， 但 是 重 载 子 程序 通常 实现 同样 的 过 程 。 

C++、jJava、Ada 以 及 C# 都 包括 了 预定 义 的 重 载 子 程序 。 例 如 ， 在 C++ Java 和 C# 中 的 类 都 
具有 重 载 的 结构 。 因为 重 载 子 程序 的 每 一 个 版 本 各 具有 一 种 独特 的 参数 特征 ， 所 以 编译 器 就 可 
以 通过 这 些 不 同类 型 的 参数 来 区 分 对 不 同 版 本 的 调用 。 不 位 的 是 ， 它 没有 那么 简单 。 受 多 许 的 
参数 强制 转换 大 大 地 增加 了 消除 歧义 过 程 的 复杂 度 。 简 单 地 说 ， 问题 是 ， 如 果 没 有 一 种 方法 的 
参数 列表 与 方法 调用 中 实 参 的 数目 和 类 型 相 匹 配 ， 但 是 两 个 或 更 多 方法 有 通过 强制 转换 匹配 的 
参数 列表 ， 编 译 器 调用 哪 种 方法 呢 ? 对 于 致力 于 解决 这 一 问题 的 语言 设计 人 员 来 说 ， 他 (她 ) 
必须 决定 如 何 将 强制 转换 分 级 ， 以 致 于 编译 器 能 选择 方法 以 最 好 地 与 调用 相 匹配 。 这 将 会 成 为 
一 个 可 怕 的 、 繁 重 的 任务 。 为 了 和 弄 明白 该 情形 的 复杂 性 ， 读者 可 以 参考 在 C++ 中 使 用 的 方法 调 
用 非 上 层 义 性 规则 (Stroustrup, 1997) , 

在 Ada 中 ， 征 通过 一 个 重 载 函 数 返 回 的 类 型 来 区 分 调用 的 是 哪 一 个 版 本 。 因此 ， 两 个 重 载 
国 数 可 以 具有 同样 的 参数 特征 ， 只 是 它们 返回 的 类 型 不 同 。 因为 Ada 不 允许 混合 模式 表达 式 ， 
所 以 函数 调用 的 上 下 文 就 能 够 说 明 从 函数 返回 的 类 型 。 例 如 ， 如 来 一 个 Ada 程 序 具有 两 个 名 称 
都 为 Fun 的 函数 ， 对 这 两 个 函数 都 输入 一 个 Integer 类 型 的 参数 ， 然 而 ， 一 个 函数 返回 一 个 
Integer 值 ， 而 另 一 个 则 返回 一 个 Float 值 ， 下 面 的 调用 将 是 合法 的 ， 


A, B : Integer; 


E 


人 
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A := B + Fun(7); 


在 这 段 代 码 中 ， 将 对 函数 Fun 的 调用 绑 定 于 返回 Integer 值 的 版 本 ， 因 为 如 果 选 择 返 回 
Float 值 的 版 本 ， 将 会 产生 类 型 错误 。 

因为 Ct++、Java 以 及 C# 都 允许 混合 模式 的 表达 式 ， 因 而 不 能 够 用 返回 类 型 来 区 分 重 载 函 数 
(或 者 重 载 方法 ) 。 也 不 能 够 根据 调用 的 上 下 文 来 确定 返回 的 类 型 。 例 如 ， 如 果 一 个 C++ 程序 具 
有 两 个 名 称 都 为 fun 的 函数 ， 对 这 两 个 函数 都 输入 一 个 int 类 型 的 参数 ， 然 而 ， 一 个 函数 返回 
一 个 int 值 ， 而 另 一 个 则 返回 一 个 float 值 ， 这 种 程序 将 不 会 被 编译 ， 因 为 编译 器 不 能 够 确定 
应 该 使 用 fun 的 哪 一 个 版 本 。 

在 Ada、Java、C++ 以 及 C# 中 ,还 允许 用 户 使 用 同样 的 名 字 来 编写 子 程序 的 多 个 版 本 。 而 且 ， 
在 Ct++、Java 和 C# 中 ， 最 常见 的 用 户 定义 的 重 载 方法 是 构造 函数 。 

有 共有 默认 参数 的 重 载 子 程序 可 能 会 导致 具有 歧义 的 子 程序 调用 。 例 如 ， 考 虑 下 面 的 C++ 
代码 : 

void fun(float b = 0.0); 

void fun(); 

fun(); 

这 个 调用 是 歧义 的 ， 它 会 引起 编译 错误 。 
9.8 通用 子 程序 


软件 的 复 用 是 软件 生产 力 增长 的 一 个 重要 促进 因素 。 增 加 软件 复 用 性 的 一 种 方式 是 减少 产 
生 那 些 在 不 同 数据 类 型 上 实现 相同 算法 的 不 同 子 程序 。 例 如 ， 一 个 编程 人 员 不 必 给 四 个 只 是 元 
素 类 型 不 同 的 数组 编写 四 个 不 同 的 排序 子 程序 。 

多 态 子 程序 在 输入 不 同类 型 的 参数 时 ， 将 启动 不 同 的 处 理 。 重 载 子 程序 提供 一 种 特殊 类 型 
的 多 态 ， 称 为 特别 多 态 。 重 载 子 程序 的 行为 不 需要 相似 。 

Python 和 Ruby 的 方法 提供 了 一 种 更 通用 的 多 态 性 。 前 面 提 到 过 ， 这 些 语言 的 变量 没有 类 型 ， 
因此 形 参 没有 类 型 。 然 而 ， 只 要 定义 了 方法 内 使 用 在 形 参 上 的 操作 符 ， 该 方法 在 任何 实 参 类 型 
情况 下 都 能 正常 使 用 。 

参数 多 态 性 由 一 个 带 有 通用 参数 的 子 程序 提供 ， 这 种 通用 参数 被 用 于 描述 子 程序 参数 类 型 
的 类 型 表达 式 之 中 。 为 这 种 类 型 的 子 程序 的 不 同 实现 给 定 不 同 的 通用 参数 ， 将 会 产生 带 有 不 同 
类 型 参数 的 子 程序 。 子 程序 的 参数 定义 都 表现 为 相同 的 行为 。 参 数 多 态 子 程序 通常 称 为 通用 子 
程序 。Ada 和 C++ 都 提供 一 种 编译 时 参数 多 态 性 。Java 5.0 也 支持 参数 多 态 性 ， 但 是 这 种 支持 方 
式 与 Ada 和 C++ 中 的 支持 方式 是 十 分 不 同 的 。 


9.8.1 Ada 中 的 通用 子 程序 


Ada 通 过 一 个 结构 来 提供 参数 多 态 性 ， 这 个 结构 支持 构造 程序 单位 的 多 个 版 本 ， 以 接受 不 
同 数据 类 型 的 参数 。 子 程序 的 不 同 版 本 是 由 编译 器 根据 来 自用 户 程序 的 请 求 进行 实例 化 或 者 构 
运 的 。 因 为 所 有 这 些 子 程序 版 本 全 都 具有 相同 的 名 字 ， 这 就 造成 了 一 种 错觉 ， 以 为 单个 子 程序 
可 以 在 不 同 的 调用 之 中 处 理 不 同类 型 的 数据 。 因 为 这 种 程序 单位 在 性 质 上 是 通用 的 ， 所 以 有 时 
将 它们 称 为 通用 单位 。 

同样 的 机 制 也 可 以 被 用 来 允许 子 程序 的 不 同 执 行 来 调用 一 个 通用 子 程序 的 不 同 实例 。 这 在 
提供 作为 参数 传递 的 子 程序 的 功能 方面 是 十 分 有 用 的 。 
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下 面 的 例子 介绍 了 一 个 具有 三 个 通用 参数 的 程序 ， 它 允许 将 一 个 通用 数组 作为 参数 传递 给 
于 程序 。 这 是 一 个 交换 排序 的 程序 ， 被 设计 用 来 处 理 任何 具有 基本 数值 类 型 元 素 的 数组 ， 而 且 
这 个 数组 使 用 任何 序数 类 型 的 下 标 : 


generic 
type Index Type is (<>); 
type Element Type is private; 
type Vector is array (Integer range <>) of 
Element Type; 
procedure Generic Sort(List : in out Vector); 
procedure Generic Sort(List : in out Vector) is 
Temp : Element Type; 
begin 
for Top in List 'First..Index_Type'Pred(List'Last) loop 
for Bottom in Index_Type'Succ(Top)..List'Last loop 
if List(Top) > List(Bottom) then 
Temp := List(Top); 
List(Top) := List (Bottom); 
List(Bottom) := Temp; 
end if; 
end loop; - for Bottom... 
end loop; - for Top ... 
end Generic Sort; 


如 朱 你 对 Ada 不 是 很 熟悉 ， 这 个 通用 程序 中 的 某 些 部 分 可 能 显得 十 分 奇怪 然而 ， 我 们 并 
不 需要 了解 这 个 过 程 的 所 有 语法 细节 ， 它 并 不 重要 。 这 里 的 数组 类 型 以 及 数组 元 素 的 类 型 是 这 
个 程序 中 的 两 个 通用 参数 。 数 组 被 声明 为 具有 任意 范围 内 的 任意 类 型 的 下 标 ( 即 ， 可 以 被 合法 
地 作为 下 标的 任何 类 型 )。 

这 个 通用 的 排序 仅仅 是 一 个 过 程 的 模板 ， 编 译 器 并 不 需要 为 它 产生 代码 ， 并 且 它 对 于 程序 
没有 影响 ， 除 非 它 为 某 一 种 类 型 进行 了 实例 化 。 这 种 实例 化 是 用 类 似 下 面 的 语句 来 完成 的 : 

Procedure Integer Sort is new Generic Sort( 

Index_Type => Integer; 


Element Type => Integer; 
Vector => Int Array); 


洞 译 器 对 这 条 语句 的 反应 是 建立 Generic_Sort 的 一 个 名 为 Integer_ sort 的 版 本 ， 这 个 
版 本 所 排序 的 数组 类 型 为 Int Array， 和 而 这 个 数组 的 元 素 类 型 为 Integer， 数 组 下 标的 类 型 
th AInteger, 

在 这 样 写成 的 Generic_sort 中 ,假设 操作 符 “>” 征 对 于 将 要 被 排序 的 数组 元 素 而 定 
pa: oe 通过 在 Generic_sort 的 通用 参数 中 包括 一 个 比较 函数 ， 束 能 够 提高 Generic 
Sort 的 通用 性 。 

前 面 说 过 ， Ada 不 允许 将 子 程序 作为 参数 传递 给 其 他 子 程序 ， 但 Ada 可 使 用 通用 形式 的 子 
程序 来 提供 这 种 功能 。 在 类 似 Fortran 的 语言 中 ， 将 子 程序 作为 参数 来 传递 ， 这 样 对 一 个 子 程序 
的 某 一 特殊 调用 就 可 以 使 用 被 特殊 传递 的 子 程序 来 计算 结果 ， 在 Ada 中 ， 通 过 人 允许 用 户 将 一 个 
通用 子 程序 进行 任意 次 数 的 实例 化 ， 每 一 次 都 产生 一 个 可 以 使 用 的 不 同 子 程序 来 获得 相同 的 结 
采 。 例 如 ， 考 虑 下 面 的 Ada 调 用 程序 ， 


generic 
with function Fun(X : Float) return Float; 
procedure Integrate (Lowerbd : in Float; 
Upperbd : in Float; 


ms 


D 
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Result : out Float); 
procedure Integrate (Lowerbd : in Float; 
Upperbd : in Float; 
Result : out Float) is 
Funval : Float; 
begin 


Funval := Fun(Lowerbd); 


aie Integrate; 
我 们 可 以 使 用 下 面 的 语句 ， 为 用 户 定义 的 函数 Fun1 对 上 面 的 程序 施行 实例 化 ， 


procedure Integrate Funl is new Integrate(Fun => Funl); 
现在 ，Integrate_Fun1l 是 对 国 数 Fun1 进 行 积 分 的 程序 。 
9.8.2 C++ 中 的 通用 函数 


C++ 中 的 通用 函数 具有 模板 函数 的 描述 性 名 称 。 一 个 模板 函数 定义 的 一 般 形式 为 : 

模板 < 模板 参数 > 

一 这 是 一 个 可 能 包括 了 模板 参数 的 函数 定义 

模板 参数 (必须 至 少 有 一 个 ) 具有 下 面 形式 中 的 一 种 : 

类 标识 符 

类 型 名 称 标识 符 

这 里 使 用 类 的 形式 作为 类 型 名 称 。 而 类 型 名 称 形式 被 用 于 传递 数值 给 模板 函数 。 例 如 ， 传 
递 模板 国 数 中 的 数组 的 维 长 整数 值 有 时 是 十 分 方便 的 。 

一 个 模板 能 够 把 另 一 个 模板 作为 参数 ， 实 际 上 ， 模 板 类 经 常 定 义 用 户 定义 通用 类 型 ， 但 我 
们 不 在 这 里 考虑 这 种 选择 。9 

作为 一 个 例子 ， 考 虑 下 面 的 模板 函数 : 

template <class Type> 

Type max(Type first, Type second) { 


return first > second ? first : second; 


} 


这 里 的 Type 是 一 个 参数 ， 它 说 明 函 数 将 要 操作 的 数据 类 型 。 可 以 将 这 个 模板 函数 对 任何 由 
操作 符 > 定义 的 类 型 进行 实例 化 。 例 如 ， 如 果 将 这 个 模板 函数 以 int 来 实施 参数 实例 化 ， 它 将 
成 为 

int max(int first, int second) { 


return first > second ? first : second; 


} 


虽然 可 以 将 这 一 过 程 定 义 成 为 一 个 宏 指令 ， 但 是 ， 如 果 这 些 参 数 是 具有 副作用 的 表达 式 ， 
这 种 宏 指 令 有 时 候 就 不 能 够 正确 地 操作 。 例 如 ， 假 设 将 宏 指 令 定义 为 À 


#define max(a, b) ((a) > (b)) ? (a) : (b) 


这 一 条 宏 指 令 是 通用 的 ， 就 它 可 以 工作 于 任意 数值 类 型 而 言 。 然 而 ， 如 果 它 的 调用 参数 具 


日 ”模板 类 将 在 第 11 章 中 讨论 。 
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有 副作用 的 话 ， 宏 指令 就 不 总 是 能 够 正确 地 工作 。 例 如 ， 


max(x++, y) 

这 将 会 产生 

(CXF) > Cy) ? (24+) 2 (¥)) 

只 要 是 x 的 值 大 于 y 的 值 ，x 的 值 将 会 增加 两 倍 。 

当 调 用 一 个 C++ 中 的 模板 函数 时 ， 或 者 是 使 用 & 操 作 符 来 获取 这 个 模板 函数 的 地 址 时 ， 模 
板 函 数 就 被 隐 式 地 实例 化 。 例 如 ， 上 面 定义 的 模板 函数 将 会 被 下 面 的 代码 段 实例 化 两 次 ， 一 次 
是 为 int 类 型 的 参数 ， 另 一 次 是 为 char 类 型 的 参数 

int a, by c; 


char d, e, f; 


© = max(a, b); ， 
f = max(d, e); 
下 面 古 曾 经 在 9.8.1 节 中 给 出 的 通用 排序 子 程序 的 C++ 版 本 。 它 在 某 种 程度 上 与 以 前 的 版 本 
有 所 不 同 ， 因 为 C++ 中 的 数组 下 标 被 限制 为 整数 ， 而 下 标的 下 限 被 固定 为 零 。 
template <class Type> 
void generic sort(Type list[], int len) { 
int top, bottom; 
Type temp; 
for (top = 0; top < len - 2; topt+) 
for (bottom = top + 1; bottom < len - 1; bottom++) 
if (list[top] > list[bottom]) { 
temp = list[top]; 
list[top] = list[bottom]; 
list[bottom] = temp; 
} //** list[top] ... 结束 
} //** end of generi 结束 


这 个 模板 函数 实例 化 的 一 个 例子 为 : 


float fit _list[100]; 
generic sort(flt_ list, 100); 


Ada 的 通用 子 程序 和 C++ 的 模板 函数 就 子 程序 而 言 是 一 对 难 兄 难 弟 ， 它们 不 同 于 常见 的 一 般 
了 于 程序 。 一 般 ， 子 程序 中 的 形 参 类 型 与 调用 中 的 实 参 类 型 被 动态 地 绑 定 ， 因此 只 需要 代码 的 单 
个 拷贝 。 然 而 在 Ada 和 C++ 的 方式 中 ， 必须 在 编译 时 为 每 一 个 不 同 的 类 型 产生 一 个 拷贝 ， 而 子 程 
序 的 调用 与 子 程序 之 间 的 绑 定 是 静态 的 。 


9.8.3 Java 5.0 中 的 通用 方法 


在 Java 5.0 中 ， 增 加 了 对 于 通用 类 型 以 及 通用 方法 的 支持 。Java 5.0 中 通用 类 的 名 称 由 尖 括 
号 限定 的 一 个 或 更 多 类 型 变量 名 来 指定 。 例 如 ， 


GenType<T> 

这 里 ，T 古 类 型 变量 。 通 用 类 型 的 更 多 内 容 将 在 第 11 章 中 讨论 。 

Java 中 的 通用 方法 与 Ada 以 及 C++ 中 的 通用 子 程序 在 几 个 重要 方面 不 同 。 第 一 ， 通 用 参数 必 
须 是 类 ， 而 不 能 够 是 基本 类 型 。 因 为 有 这 种 要 求 ， 就 不 允许 一 个 通用 方法 模仿 我 们 在 Ada 和 
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C++ 中 的 那些 例子 ， 在 那些 例子 中 ， 数 组 部 件 的 类 型 既是 通用 类 型 的 ， 同 时 又 可 以 是 基本 类 型 
的 。Java 中 的 数组 部 件 的 类 型 (与 容器 相反 ) 则 不 能 够 是 通用 的 。 第 二 ， 尽 管 Java 通 用 方法 的 
实例 化 能 够 进行 多 次 ， 但 是 只 有 一 个 代码 拷贝 产生 了 。 一 个 通用 方法 的 内 部 版 本 称 为 raw 方 法 ， 
在 类 对 象 Object 上 施行 操作 。 当 返回 一 个 通用 方法 的 通用 值 时 ， 编 译 器 将 揪 入 一 种 类 型 转换 ， 
以 便 将 其 转换 成 为 合适 的 类 型 。 第 三 ， 在 Java 中 ， 限 制 能 够 指定 在 传递 通用 方法 作为 通用 参数 
的 类 的 苑 围 内 。 这 样 的 限制 称 为 界限 (bound), 

作为 通用 Java 5.0 方 法 的 例子 ， 考 虑 下 列 的 方法 定义 框架 。 


public static <T> T DoIt(T[] list) { 
} 


EEX SA A ARC RA Dot, HARM ART, MAE MAPA 
组 。 下 面 定 调用 DoIt 的 例子 : 
DoIt<int>(myList); 


现在 ， 考 虑 下 面 形成 的 doIt， 它 在 其 通用 参数 上 有 界限 : 


public static <T extends Comparable> T doIt(T[] list) 4 
} 


这 定义 了 一 个 方法 ， 该 方法 带 有 通用 数组 参数 ， 其 元 素 是 实现 comparable 接 口 的 类 。 那 
征 通用 参数 的 限制 或 界限 。 保 留 字 extends 似 乎 暗示 通用 类 子 类 化 接 下 来 的 类 。 然 而 在 这 里 ， 
extends 有 不 同 的 含义 。 表 达 式 <T extends BoundingType> 指 定 IT 应 该 是 绑 定 类 型 的 “ 子 
类 型 。 因 此 在 这 里 ，extends 表 示 通 用 类 (或 接口 ) 扩展 绑 定 类 (如 果 绑 定 的 是 类 ) 或 实现 
绑 定 接口 《如 果 绑 定 的 是 接口 ) 。 绑 定 保 证 任何 通用 实现 的 元 素 都 能 与 comparable 方 法 
CompareTo 相 比较 。 

如 末 一 个 通用 方法 对 于 它 的 通用 类 型 存在 着 两 种 或 者 多 种 的 限制 ， 则 将 这 些 限制 放 入 
extends 子 句 ， 并 通过 符号 & 将 这 些 限制 分 开 。 另 外 ， 通 用 方法 可 以 具有 多 个 通用 参数 。 

Java 5.0 文 持 通 配 (wildcard) 类 型 。 例 如 ，Collection<?> 就 是 collection 类 的 一 个 
通 配 类 型 。 可 以 将 这 种 类 型 用 作 任 何 类 部 件 的 任何 collection 类 型 。 例 如 ， 考 虑 下 面 的 通用 
方法 : 

void printCollection(Collection<?> c) { 

for (Object e: c) { 
System.out.println(e); 


} 


这 个 方法 将 打印 出 任何 collection 类 中 的 元 素 ， 而 不 论 它 的 部 件 的 类 是 什么 。 在 使 用 通 
配 类 型 的 对 象 时 必须 小 心 。 例 如 ， 因 为 这 种 类 型 的 某 一 个 特殊 对 象 的 部 件 具有 一 种 类 型 ， 就 不 
能 够 将 其 他 类 型 的 对 象 再 放 入 这 个 集合 中 。 例 如 ， 

Collection<?> c = new ArrayList<String>(); 

如 林 使 用 add 方 法 将 Stzing 类 型 以 外 的 类 型 放 人 这 个 集合 中 ， 就 是 不 合法 的 。 

束 像 对 于 非 通 配 类 型 一 样 ， 也 可 以 对 通 配 类 型 施加 一 些 限制 。 我 们 将 这 种 受 限制 通 配 类 型 
称 为 绑 定 的 通 配 类 型 。 例 如 ， 考 虑 下 面 方法 中 的 首部 ; 


public void drawAll(ArrayList<? extends Shape> things) 


子 # F 287 





这 里 的 通用 类 型 是 一 种 通 配 类 型 ， 它 是 Shape 类 的 一 个 子 类 。 可 以 使 用 这 个 方法 来 画 出 类 
型 为 Shape 类 的 子 类 的 任何 对 象 。 


9.8.4 C# 2005 的 通用 方法 


C# 2005 的 通用 方法 与 Java 5.0 相 似 ， 除 了 不 支持 通 配 类 型 之 外 。 一 个 C# 2005 通 用 方法 的 独 
特 特性 是 ， 如 果 编 译 器 能 推测 未 指定 类 型 ， 则 可 以 忽略 调用 中 的 实 参 类 型 。 例 如 ， 考 虑 下 面 的 
类 定义 框架 : 

class MyClass { 

public static T doIt<T>(T pl) { 

} 

} 

如 未 编译 器 能 从 调用 时 的 实 参 推测 通用 类 型 ， 那 么 不 需要 指定 通用 参数 就 能 调用 方法 Dolt 
例如 ， 下 面 调用 都 是 合法 的 : 


int myInt = MyClass.DoIt(17); // Calls DoIt<int> 
string myStr = MyClass.DoIt('apples'); // Calls 
DoIt<string> 


9.9 函数 的 设计 问题 


下 面 的 两 个 设计 问题 是 函数 所 特有 的 : 
* 允许 函数 具有 副作用 吗 ? 
© 国 数 可 以 返回 什么 类 型 的 值 ? 


9.9.1 函数 的 副作用 


如 在 第 5 章 中 曾经 描述 过 的 ， 因 为 在 表达 式 中 调用 的 函数 所 具有 的 副作用 问题 ， 传 递 给 函数 
的 参数 应 该 总 是 输入 型 的 。 事 实 上 有 一 些 语言 就 是 这 样 来 要 求 的 ， 例 如 ，Ada 的 函数 就 只 能 能 
具有 输入 型 的 形 参 。 这 种 要 求 有 效 地 阻止 了 函数 通过 它 的 参数 或 者 通过 参数 的 别名 使 用 以 及 全 
局 变量 的 别名 使 用 而 引起 的 副作用 。 然 而 在 大 多 数 其 他 的 语言 中 ， 函 数 也 可 以 有 按 值 传递 或 老 
按 引 用 传递 的 参数 ， 这 样 就 允许 了 产生 副作用 和 别名 使 用 的 函数 。 


9.9.2 返回 值 的 类 型 


大 多 数 的 命令 式 程序 设计 语言 限制 它们 的 函数 所 能 够 返回 的 类 型 。C 语 言 多 许 它 的 函数 激 
回 任何 类 型 ， 除 了 数组 和 函数 以 外 ， 而 且 可 以 通过 指针 类 型 的 返回 值 来 处 理 这 两 种 不 被 介 许 的 
类 型 。C++ 也 像 C 一 样 ， 但 是 C++ 还 允许 从 它 的 函数 返回 用 户 定义 的 类 型 或 者 类 。Ada、Python 
和 Ruby 语 言 与 其 他 的 当代 命令 式 语言 不 一 样 ， 它 的 函数 可 以 返回 任何 类 型 的 值 。 然 而 ， 因 为 在 
Ada 中 的 函数 不 是 类 型 ， 因 而 函数 不 能 够 返回 函数 。 当 然 ， 函 数 可 以 返回 指向 函数 的 指针 ， 

在 一 些 程序 设计 语言 之 中 ， 子 程序 是 第 一 等 级 的 对 象 ， 这 意味 着 可 以 类 似 于 处 理 数 据 对 象 
一 样 来 处 理 它们 。 例 如 ， 在 JavaScript 中 ， 可 以 将 函数 作为 参数 来 传递 ， 以 及 作为 参数 从 函数 中 
总 回 。 在 Python 和 Ruby 中 ， 方 法 是 能 被 处 理 为 其 他 任何 对 象 的 对 象 。 许 多 函数 式 语言 也 采用 了 
这 样 的 方式 (参见 第 15 章 )。 

Javal 人 及 C# 都 不 能 够 有 函数 ， 尽 管 其 中 的 方法 与 函数 相 类 似 。 在 这 两 种 语言 中 ， 方 法 可 以 
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返回 任何 类 型 或 者 任何 类 。 然 而 方法 不 是 类 型 ， 因 而 不 能 够 将 方法 返回 。 


9.10 用 己 定 义 的 重 载 操作 符 


在 Ada 和 C++ 程 序 中 ， 用 户 可 以 将 操作 符 重 载 。 作 为 一 个 例子 ， 考 虑 下 面 的 Ada 函数 ， 这 
个 函数 将 乘法 操作 符 (*) 重 载 ， 以 计算 两 个 数组 的 点 积 。 两 个 数组 的 点 积 是 这 两 个 数组 中 对 应 
元 素 对 的 乘积 之 总 和 。 假 设 ， 定 义 Vector_TYyPpe 为 具有 Integez 元 素 的 数组 类 型 


function "*"(A, B : in Vector Type) return Integer is 
Sum : Integer := 0; 
begin 
for Index in A’range loop 
Sum := Sum + A(Index) * B(Index); 
end loop; -- for Index ... 
return Sum; 
end "*"; 


正如 在 这 个 函数 的 定义 中 说 明 的， 每 当 乘法 操作 符 (*) 出 现 于 类 型 为 Vector_Type 的 两 
个 操作 数 之 同时， 就 计算 点 积 。 还 可 以 进一步 将 乘法 操作 符 重 载 任意 次 数 ， 只 要 定义 的 函数 中 
有 具有 唯一 的 协议 。 

也 可 以 用 C++ 来 编写 上 面 的 点 积 函 数 。 这 种 函数 的 一 种 原型 可 以 为 


int operator *(const vector &a, const vector &b, int len); 


读者 自然 会 提出 一 个 问题 : 将 操作 符 重 载 多 少 次 为 好 ， 或 者 说 ， 会 不 会 重 载 太 多 次 数 了 ? 
这 里 的 答案 是 ， 这 在 很 大 程度 上 取决 于 你 的 风格 。 反 对 将 操作 符 太 多 次 重 载 主要 考虑 的 是 可 读 
性 。 在 很 多 情况 下 ， 调 用 一 个 函数 来 执行 一 种 操作 ， 相 对 于 使 用 一 个 经 常 被 用 于 其 他 操作 数 的 
操作 符 ， 可 读 性 常常 更 好 。 甚 至 是 对 于 点 积 的 情形 ， 可 能 都 会 容易 忘记 在 程序 中 发 现 的 一 条 简 
[430] ” 单 赋 值 语 句 都 涉及 了 什么 ， 如 在 程序 中 发 现 ， 


=a* b 


会 很 容易 地 假设 : a,b 和 c 都 是 简单 的 数量 标量 。 
另外 的 一 种 考虑 ， 是 使 用 不 同 的 开发 人 员 创 建 的 模块 
supune 来 建造 软件 系统 的 过 程 。 如 果 这 些 不 同 的 开发 人 员 以 不 同 
Pet piae 的 方式 将 同一 个 操作 符 重 载 的 话 ， 显 然 ， 在 将 这 些 重 裁 操 
的 协同 程序 的 应 用 之 _， 呈 去 语 。， 作 符 放 入 系统 之 前 ， 必 须 消除 掉 它们 之 间 的 差别 。 
法 分 析 领 域 (Conway, 1963), 9.11 协同 程序 
第 一 种 包括 了 协同 程序 功能 的 高 
级 程序 设计 语言 是 SIMULA 67, 协同 程序 是 一 种 特殊 类 型 的 子 程序 。 不 像 在 传统 程序 
M ayit, SIMULAR $ tka ， 中 的 调用 子 程序 与 被 调用 子 程序 之 间 存 在 的 主 - 从 关系 ， 调 
目的 是 系统 模拟 ， 这 常常 需要 进 ”用 与 被 调用 的 协同 程序 之 间 是 基于 更 平等 的 关系 。 事 实 上 ， 
行 独立 过 程 的 模拟 。 正 是 这 种 需 通 第 称 协同 程序 的 控制 机 制 为 对 称 单 位 控制 模式 
求 成 为 了 在 SIMULA 67 中 开发 协 (symmetric unit control model) , 
同 程序 的 动机 。 其 他 支持 协同 程 协同 程序 具有 多 个 自身 控制 的 入 口 ， 也 具有 保存 活动 之 
序 的 语言 有 BLISS (Wulf et al., 则 状态 的 机 制 。 这 意味 着 ,协同 程序 必须 是 历史 敏感 的 ， 并 
1971); INTERLISP (Teitelman, 日 因 此 而 具有 静态 局 部 变量 。 一 个 协同 程序 的 非 首次 执行 通 
ne gan a 常 不 是 从 程序 开头 的 位 置 开 始 。 正 因为 这 种 事实 ， 协 同 程序 
| 的 激活 被 称 为 重新 启动 (resume) ， 而 不 是 调用 。 
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例如 ， 考 虑 下 面 的 协同 程序 框架 ; 


sub col(){ 
Sota c02( )-: 
ee co3(); 
, 


第 一 次 col 启 动 执行 ， 它 从 第 一 条 语句 开始 ， 执 行 向 下 ， 启动 co2， 并 把 控制 传递 给 co2， 
第 二 次 co1 启 动 执行 ， 它 在 调用 co2 后 第 一 条 语句 处 执行 。 当 第 三 次 启动 执行 col 时 ， 它 在 启动 执 
行 co3 后 的 第 一 条 语句 处 开始 执行 。 

协同 程序 中 保持 了 一 个 子 程序 的 常见 特征 : 在 任何 给 定 的 时 刻 ， 只 有 一 个 协同 程序 在 执行 。 

正如 下 面 例子 中 说 明 的 那样 ， 然而 协同 程序 并 不 是 一 直 执 行 到 结束 ， 经 常 只 是 部 分 地 执行 ， 
然后 将 控制 转移 到 另 一 个 协同 程序 。 当 执行 重新 开始 时 协同 程序 在 用 于 转移 控制 的 语句 之 后 
重新 启动 执行 。 这 样 的 执行 顺序 与 多 处 理 器 操作 系统 的 工作 方式 有 关 、 虽然 这 里 可 能 只 有 一 个 
处 理 器 ， 但 这 种 系统 中 的 所 有 执行 程序 似乎 都 在 共享 这 个 处 理 器 ， 而 并 发 地 运行 。 在 协同 程序 
里 ， 有 了 时 将 这 种 情形 称 为 准 并 发 (quasi-concurrency)。 

十 分 典型 的 是 ， 在 应 用 中 是 由 一 个 称 为 主 单位 的 程序 单位 来 创建 协同 程序 。 这 个 主 程序 单 
位 并 不 是 一 个 协同 程序 。 被 创建 之 后 ， 协同 程序 将 执行 它们 的 初始 化 代码 ， 然后 将 控制 返回 给 
主 单位 。 当 构 造 出 了 一 个 协同 程序 家 族 的 所 有 成 员 之 后 ， 主 程序 将 重新 启动 这 些 协同 程序 中 的 
= 然后 协同 程序 家 族 的 成 员 以 某 种 顺序 相互 地 重新 启动 直到 完成 任务 ， 如 果 任 务 可 以 完成 
的 话 。 如 采 一 个 协同 程序 的 执行 达到 了 它 的 代码 段 的 未 端 ， 控制 将 返回 到 创建 它 的 主 单位 。 这 
束 是 当 需 要 的 时 候 结束 一 组 协同 程序 的 执行 机 制 。 在 某 些 程序 中 ， 每 当 计算 机 开始 运行 时 ， 协 
同 程序 也 同时 启动 运行 。 

一 组 协同 程序 在 一 起 解决 问题 的 一 个 例子 是 模拟 一 种 纸牌 游戏 ， 假设 这 种 游戏 有 四 个 牌 手 
来 玩 ， 他 们 都 使 用 相同 的 策略 。 可 以 用 一 个 主 程序 单位 产生 出 一 个 协同 程序 家 族 来 模拟 这 种 游 
戏 ， 每 一 个 协同 程序 初始 化 以 得 到 一 手 牌 ， 然后 主 程序 可 以 重新 启动 其 中 的 一 个 牌 手 协同 程序 
来 开始 模拟 ， 这 个 牌 手 玩 过 了 自己 的 一 轮 之 后 ， 义 可 以 重新 启动 下 一 个 牌 手 协同 程序 ， 依 此 类 
推 ， 直 到 游戏 结束 。 

可 以 使 用 同样 形式 的 重新 启动 语句 ， 来 开始 或 者 重新 开始 一 个 协同 程序 的 执行 。 

假设 程序 单位 A 和 B 为 协同 程序 。 图 9-3 显 示 了 涉及 A 和 B 的 执行 顺序 的 两 种 方式 。 

在 图 9-3a 中 ， 通过 主 单 位 来 启动 协同 程序 A 的 执行 。 经 过 了 一 段 执行 之 后 ，A 再 启动 B。 当 
图 9-3a 中 的 协同 程序 B 将 控制 返回 到 协同 程序 A 时 ， 语义 为 A 从 它 上 次 执行 结束 之 处 再 继续 执行 。 
尤其 是 ， 它 的 局 部 变量 具有 上 次 执行 时 留 下 来 的 值 图 9-3b 显 示 了 协同 程序 A 和 B 的 另 一 种 执行 
顺序 。 在 这 种 情形 下 ，B 被 主 单位 启动 。 | 

不 同 于 图 9-3 中 显示 的 模式 ， 协同 程序 常常 具有 一 个 循环 ， 用 以 包含 它 的 重新 启动 语句 。 
图 9-4 显 示 了 这 种 情况 下 的 执行 顺序 。 在 这 种 情形 下 ， A 由 主 单位 来 启动 。 在 它 的 主 循环 的 内 部 ， 
A 重新 启动 B， 而 B 反 过 来 又 在 它 的 主 循环 中 重新 启动 A。 
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图 9-3 两 个 不 具有 循环 的 协同 程序 可 能 的 执行 控制 顺序 


resume 一 一 六 


从 主 单元 





图 9-4 两 个 具有 循环 的 协同 程序 的 执行 顺序 
小 结 


在 程序 设计 语言 中 ， 过 程 抽象 由 子 程序 表示 。 子 程序 的 定义 描述 子 程序 代表 的 行为 。 而 子 程序 的 调 
用 则 激活 这 种 行为 。 

形 参 是 一 些 参数 名 称 ， 子 程序 使 用 这 些 名 称 来 引用 那些 在 子 程序 调用 之 中 的 实 参 .Python 和 Ruby 的 
数组 和 散 列 形 参 用 来 支持 参数 的 变量 数 。Ruby 允 许 方 法 调用 时 加 入 块 。 抉 可 以 带 参 数 。 在 被 调用 的 方法 
里 ， 调 用 它们 时 带 有 yield 语 句 。 

子 程序 可 以 是 函数 或 者 过 程 。 前 者 模拟 数学 函数 ， 并 且 被 用 于 定义 新 的 操作 ， 后 者 则 被 用 于 定义 新 
的 语句 。 

子 程序 中 的 局 部 变量 可 以 是 栈 动态 的 ， 以 支持 递归 ， 也 可 以 是 静态 的 ， 给 局 部 变量 提供 高 效率 以 及 
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历史 敏感 性 。 
参数 传递 共有 三 种 基本 语义 模式 ， 输 入 型 、 输 出 型 以 及 输入 输出 型 ， 它 还 有 多 种 实现 方式 。 


当 使 用 按 引用 传递 的 参数 时 ， 可 能 在 两 个 或 者 多 个 参数 之 间 ， 以 及 在 一 个 参数 与 一 个 可 存 取 的 非 局 
部 变量 之 间 ， 产 生 别 名 使 用 。 

是 子 程序 的 名 称 的 参数 提供 了 一 种 十 分 必要 的 机 制 ， 但 有 时 却 难以 理解 。 当 运行 一 个 被 作为 参数 来 
传递 的 子 程序 时 ， 难 以 区 分 其 引用 环境 。 

Ada、C++、C# Ruby 和 Python 人 允许 子 程序 以 及 操作 符 的 重 载 。 子 程序 可 以 是 重 载 的 ， 只 要 子 程序 的 各 
种 版 本 中 的 参数 类 型 或 者 所 返回 的 值 不 具有 歧义 性 。 可 以 使 用 函数 的 定义 来 构造 操作 符 的 额外 意义 。 

通过 使 用 参数 的 多 态 ，Ada、C++ 和 Java 5.0 中 的 子 程序 可 以 为 通用 的 。 这 样 就 可 以 将 所 需要 的 数据 对 
象 的 类 型 传递 给 编译 器 ， 然 后 编译 器 就 能 够 构造 所 需要 类 型 的 单位 。Java 5.0 中 的 方法 也 可 以 是 通用 的 ， 
然而 是 以 一 种 更 加 受 限 的 、 也 更 具有 空间 效率 的 方式 。 

协同 程序 是 一 种 具有 多 个 人 口 的 特殊 子 程序 。 可 以 使 用 这 种 程序 来 提供 子 程序 的 交错 执行 。 


复习 题 


1. 子 程序 的 三 个 共同 特征 是 什么 ? 

2. 一 个 子 程序 是 活跃 的 意味 着 什么 ? 

3. 什 么 是 参数 捅 绘 ? 什么 是 子 程序 的 协议 ? 

4. 什么 是 形 参 ? 什么 是 实 参 ? 

5. 关键 字 参 数 的 优点 与 缺点 各 是 什么 ? 

6. 子 程序 有 哪些 设计 问题 ? 

7. 动 态 局 部 变量 的 优点 与 缺点 各 是 什么 ? 

8. 参数 传递 有 哪 三 种 语义 模式 ? 

9. 什么 是 传递 的 模式 和 传递 的 概念 模式 ? 参数 传递 的 按 值 传递 、 按 结果 传递 、 按 值 与 结果 传递 以 及 按 引 
用 传递 ， 这 些 方 式 各 自 具 有 什么 优点 与 缺点 ? 

10. 在 按 引 用 传递 参数 时 ， 别 名 将 以 什么 样 的 方式 出 现 ? 

11. 当 所 处 理 的 实 参 类 型 与 它 相 对 应 的 形 参 类 型 不 一 致 时 ， 早 期 的 C 与 C89 版 本 在 处 理 方 式 上 有 什么 不 同 ? 

12. Ada 的 策略 允许 实现 人 员 决 定 ， 哪 些 参数 使 用 按 引用 传递 ， 哪 些 参数 使 用 按 值 与 结果 传递 ， 这 种 方式 “|434| 
存在 什么 问题 ? 

13. 对 于 参数 传递 的 方法 ， 有 哪 两 种 基本 的 设计 考虑 ? 

14. 当 将 子 程序 名 作为 参数 时 ， 会 产生 哪 两 种 问题 ? 

15. 定义 作为 参数 传递 的 子 程序 ， 其 引用 环境 的 浅 绑 定 以 及 深 绑 定 。 

16. 什么 是 重 载 的 子 程序 ? 

17. 什么 是 参数 的 多 态 ? 

18. C++ 的 模板 国 数 的 实例 化 是 由 什么 引起 的 ? 

19. 通用 参数 对 于 Java 5.0 中 的 通用 方法 与 C++ 中 的 方法 ， 在 哪些 基本 方式 上 不 同 ? 

20. 如 果 Java 5.0 中 的 一 个 方法 返回 一 种 通用 类 型 ， 它 实际 上 返回 的 是 对 象 的 什么 类 型 ? 

21. 如 来 调用 了 Java 5.0 中 的 一 个 通用 方法 ， 编 译 器 将 产生 这 个 方法 的 几 个 版 本 ? 

22. 函数 的 设计 问题 是 什么 ? 

23. 协同 程序 与 传统 的 子 程序 在 哪些 方面 不 同 ? 


练习 题 


1. 对 于 在 用 户 程 序 中 为 现存 的 操作 符 增加 额外 的 定义 ， 如 在 Ada 和 C++ 中 那样 ， 支 持 和 反对 这 种 方法 的 论 
凡是 什么 ?你 相信 这 种 用 户 定义 的 操作 符 重 载 好 还 是 不 好 ?请 给 出 理由 。 
2. 在 大 多 数 的 Fortran IV 实 现 中 ， 参 数 是 按 引用 传递 的 ， 仅 传递 存 取 途径 。 陈 述 这 种 设计 选择 的 优点 与 
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缺点 。 


3. 给 出 你 的 论点 ， 来 支持 Ada 83 的 设计 人 员 人 允许 实现 人 员 在 实现 in out 型 (输入 输出 型 ) 参数 时 于 通过 


复制 或 引用 之 间 所 做 出 的 选择 决定 。 


4. 假 如 你 愿意 编写 一 个 子 程序 ， 这 个 子 程序 在 新 的 输出 页 上 打印 一 个 标题 ， 连 同一 个 开始 启动 时 为 1 并 在 
每 次 活动 时 增加 1 的 页 码 。 如 果 不 使 用 参数 ， 也 没有 对 非 局 部 变量 的 引用 ， 你 能 不 能 够 在 Java 中 完成 这 


项 任务 ? 也 能 够 在 C# 中 完成 这 项 任务 吗 ? 
5. 考虑 使 用 C 中 语法 编写 的 下 面 的 程序 : 


void swap(int a, int b) { 
int temp; 
temp = a; 
a = )b; 
b = temp; 
} 
void main() { 
int value = 2, list[5] = {1, 3, 5, Fa See 
Swap(value, list[0]); 
Swap(list[0], list[1]); 
Swap(value, list[value]); 


} 

对 于 下 面 每 一 种 参数 传递 方法 ， 在 对 swap 三 次 调用 中 的 每 次 调用 之 后 ， 变 量 value 和 变量 List 的 值 各 
是 什么 ? 

a. 按 值 传递 

b. 按 引 用 传递 


c. 按 值 与 结果 传递 
.给 出 反对 在 子 程序 中 同时 提供 静态 和 动态 局 部 变量 的 论据 。 
. 考虑 使 用 C 中 语法 编写 的 下 面 的 程序 : 


void fun (int first, int second) { 
first += first; 
second += second; 

} 

void main() { 
int list[2] = {1, 3}; 
fun(list[0], list[1]); 


aD 


} 

对 于 下 面 每 一 种 参数 传递 的 方法 ， 在 执行 程序 之 后 ， 数 组 list 的 值 将 是 什么 ? 
a. 按 值 传递 

b. 按 引用 传递 


c. 按 值 与 结果 传递 
8. 给 出 反对 在 C 的 设计 中 仅 提 供 函 数 子 程序 的 论据 。 


9. 从 一 本 Fortran 教 科 书 上 学 习 语 句 函数 的 语法 和 语义 。 论 证 在 Fortran 语言 中 存在 语句 函数 的 正确 性 。 
10. 学 习 人 在 C++ 和 Ada 语 言 中 用 户 定义 操作 符 重 载 的 方法 ， 并 运用 我 们 评估 语言 的 标准 ， 写 出 比较 这 两 种 方 


法 的 报告 。 
1. C# 语 言 支持 输出 型 参数 ， 然 而 ，Java 和 C++ 却 不 支持 。 请 解释 这 种 差别 。 


2 研究 以 使 用 按 名 传递 的 参数 而 闻名 的 Jensen 设 备 ， 请 简略 地 描写 这 种 设备 是 什么 ， 以 及 如 何 使 用 这 种 


设备 。 
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程序 设计 练习 题 

.编写 一 个 Fortran 程 序 ， 这 个 程序 将 确定 你 所 涉及 的 一 种 Fortran 编 译 器 究竟 是 将 局 部 变量 实现 为 静态 的 ， 
还 是 实现 为 栈 动态 的 。 提 示 : 检测 这 个 问题 的 最 容易 方式 是 让 你 的 程序 测试 一 个 子 程序 的 历史 敏感 性 。 

使 用 你 所 知道 的 一 种 语言 编写 一 个 程序 ， 这 个 程序 将 确定 按 引 用 传递 一 个 大 数组 所 需要 的 时 间 ， 与 按 
值 传递 同样 一 个 数组 所 需要 时 间 之 比 。 在 机 器 可 能 的 范围 之 内 ， 建 立 一 个 尽 可 能 大 的 数组 ， 并 且 实 现 
你 的 这 种 应 用 。 尽 可 能 多 次 地 传递 这 个 数组 ， 以 便 获取 传递 操作 的 精确 时 间 。 

.编写 一 个 C# 或 者 Ada 程 序 ， 这 个 程序 将 确定 在 什么 时 候 计 算 一 个 输出 型 参数 的 地 址 (是 在 调用 时 , 还 是 
在 子 程序 执行 结束 之 时 )。 

.编写 一 个 Perl 程 序 ， 这 个 程序 将 按 引 用 传递 的 方式 将 一 个 字面 常量 传递 给 一 个 子 程序 ， 而 这 个 子 程序 将 
会 试图 改变 这 个 参数 。 在 Perl 语 言 总 体 设计 思想 的 前 提 下 ， 解 释 这 种 结果 。 

.使 用 C# 语 言 重复 程序 设计 练习 题 4。 

.使 用 一 种 语言 来 编写 一 个 程序 ， 在 这 种 语言 的 子 程序 中 的 局 部 变量 既 可 以 是 静态 的 ， 又 可 以 是 栈 动态 
的 。 在 子 程序 中 产生 6 个 大 型 矩阵 (至少 是 100 x 100 的 ) ， 其 中 的 三 个 为 静态 的 ， 另 外 的 三 个 为 栈 动态 
的 。 使 用 范围 为 1 到 100 的 随机 数字 将 两 个 静态 的 矩阵 以 及 两 个 栈 动态 的 矩阵 填 满 。 子 程序 中 的 代码 必 
须 在 静态 矩阵 上 进行 大 量 次 数 的 和 矩阵 乘法 ， 并 且 将 计算 过 程 计时 。 然 后 再 在 栈 动态 矩阵 上 重复 进行 同 
样 的 计算 。 比 较 并 且 解 释 这 两 种 计算 的 结果 。 

编写 一 个 C# 程 序 ， 在 程序 中 包括 被 重复 多 次 调用 的 两 种 方法 ， 这 两 种 方法 都 传递 一 个 大 数组 ， 其 中 的 
一 种 方法 是 按 值 传递 ， 另 外 的 一 种 则 按 引用 传递 。 比 较 调用 这 两 个 方法 所 需要 的 时 间 ， 并 且 解 释 这 种 差 
别 。 一 定 要 足够 多 次 地 调用 这 两 种 方法 ， 以 便 能 够 说 明 它 们 在 所 需 时 间 上 的 差别 . 

-编写 一 个 Ada 程 序 ， 这 个 程序 将 确定 ， 如 果 一 个 函数 被 通过 指针 传递 给 另 一 个 函数 ， 调 用 这 个 函数 是 
否 合法 。 

编写 一 个 程序 ， 使 用 无 论 哪 种 你 喜欢 的 语言 的 语法 ， 在 参数 传递 时 使 用 按 引用 传递 或 按 值 和 结果 传递 
来 产生 不 同 的 行为 。 

10. 编写 一 个 Ada 通 用 函数 ， 这 个 函数 取 一 个 具有 通用 元 素 的 数组 作为 参数 ， 并 且 以 同样 类 型 的 标量 来 作为 
数组 中 的 元 素 。 这 些 数组 元 素 的 类 型 以 及 这 些 标量 是 通用 参数 。 数 组 的 下 标 是 正 整数 。 这 个 函数 必须 
在 给 定 的 数组 之 中 搜索 给 定 的 标量 ， 并 且 返 回 这 个 标量 在 数组 中 的 下 标 值 。 如 果 这 个 标量 没有 在 数组 
中 ， 函 数 就 必须 返回 一 1。 将 函数 实例 化 为 Integer 以 及 Float 两 种 类 型 ， 并 且 对 这 两 种 实例 化 情形 进 
行 测试 。 

编写 一 个 C++ 通 用 函数 ， 这 个 函数 取 一 个 具有 通用 元 素 的 数组 作为 参数 ， 并 且 以 同样 类 型 的 标量 来 作 
为 数组 中 的 元 素 。 这 些 数 组 元 素 的 类 型 以 及 这 些 标量 是 通用 参数 。 这 个 函数 必须 在 给 定 的 数组 中 搜索 
给 定 的 标量 , 并 且 返 回 这 个 标量 在 数组 中 的 下 标 值 。 如 果 这 个 标量 没有 在 数组 中 ， 函数 就 必须 返回 — 1. 
对 于 int 和 float 这 两 种 类 型 ， 测 试 这 个 函数 。 

12. 设计 一 个 子 程序 和 调用 代码 ， 其 一 个 或 多 个 参数 是 按 引 用 传递 和 按 值 和 结果 传递 的 ， 以 产生 不 同 的 
结果 。 
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第 10 章 实现 子 程序 


本 章 的 目的 是 研究 实现 子 程序 的 方法 。 这 些 讨论 将 给 读者 提供 子 程序 链接 如 何 工 作 的 详细 
情况 ， 以 及 为 什么 ALGOL 60 在 20 世 纪 60 年 代 早 期 对 毫 无 警惕 的 编译 器 编写 人 员 曾 经 是 一 种 挑 
战 。 我 们 将 从 最 简单 的 子 程序 开始 : 具有 静态 的 局 部 变量 、 不 能 航 套 的 子 程序 ， 然 后 提升 到 具 
有 栈 动态 变量 的 较 复 杂 子 程序 ， 最 后 再 到 具有 栈 动态 变量 以 及 非 局 部 作用 域 的 坐 套 子 程序 。 在 
具有 航 套 子 程序 的 语言 中 ， 实 现 子 程序 的 额外 困难 是 由 需要 引入 ， 支 持 非 局 部 变量 的 存 取 机 制 
而 引起 的 。 

我 们 将 详细 地 讨论 ， 在 静态 作用 域 的 语言 中 存 取 非 局 部 变量 的 静态 连接 方法 。 而 对 实现 块 
的 技术 将 给 予 向 略 描述 。 我 们 还 将 讨论 ， 在 一 种 动态 作用 域 的 语言 中 ， 存 取 非 局 部 变量 的 几 种 
方法 。 

10.1 至 10.5 市 讨论 的 全 是 在 静态 作用 域 的 语言 中 实现 子 程序 ， 而 10.6 市 讨论 的 是 在 动态 作用 
域 的 语言 中 实现 子 程序 。 


10.1 调用 与 返回 的 一 般 语义 


我 们 将 子 程序 的 调用 及 返回 操作 统称 为 这 种 语言 的 子 程 序 链接 。 子 程序 的 任何 实现 方法 都 
必须 以 实现 语言 的 子 程序 连接 的 语义 为 基础 。 

在 一 种 典型 的 语言 中 ， 与 子 程序 调用 相关 的 动作 有 很 多 。 这 种 调用 过 程 必须 包括 无 论 使 用 
何 种 参数 传递 的 方法 的 实现 。 如 果 局 部 变量 是 非 静态 的 ， 这 种 调用 必须 对 在 被 调用 子 程序 中 声 
明 的 局 部 变量 进行 存储 空间 的 分 配 ， 还 必须 将 这 些 变量 与 所 分 配 的 存储 空间 相 绑 定 。 它 必须 保 
留 调用 程序 单位 的 执行 状态 。 执 行 状 态 是 任何 需要 重新 启动 调用 程序 单元 的 状态 。 它 包括 寄存 
器 值 、CPU 状 态 位 和 环境 指针 (EP)。EP 用 来 在 子 程序 执行 期 间 存 取 参数 和 局 部 变量 ， 第 10.3.2 
市 将 对 它 作 更 深入 的 讨论 。 调 用 过 程 必须 安排 将 控制 转移 到 子 程序 的 代码 ， 并 且 在 子 程序 执行 
结束 后 必须 确保 能 够 将 控制 返回 到 正确 的 位 置 。 最 后 ， 如 果 这 种 语言 支持 戏 套 子 程序 ， 调 用 过 
程 还 必须 产生 茶 种 机 制 ， 以 提供 对 被 调用 子 程序 为 可 见 的 、 非 局 部 变量 的 访问 。 

子 程序 返回 所 必需 的 动作 十 分 复杂 。 如 果 这 种 子 程序 具有 输出 型 参数 ， 并 且 是 通过 复制 来 
实现 的 ， 那 么 返回 过 程 的 第 一 个 动作 就 是 将 形 参 的 局 部 值 转移 到 相关 联 的 实 参 上 。 下 一 步 , 它 
必须 将 局 部 变量 使 用 的 存储 空间 解除 分 配 ， 并 且 恢 复 调用 程序 的 执行 状态 。 如 果 这 种 语言 支持 
代 套 子 程序 的 话 ， 还 必须 采取 一 些 行动 ， 将 非 局 部 引用 的 机 制 返回 到 调用 之 前 的 状态 。 最 后 ， 
必须 将 控制 返回 到 调用 程序 。 


10.2 实现 “简单 ” 子 程序 


我 们 从 实现 简单 子 程序 的 任务 开始 。 这 里 的 “简单 ” 指 的 是 ， 子 程序 不 能 够 是 戏 套 的 ， 并 
且 所 有 的 局 部 变量 都 是 静态 的 。 早 期 的 Fortran 语 言 就 具有 这 类 子 程序 。 对 一 个 “简单 ” 子 程序 
调用 的 语义 要 求 有 下 面 这 些 动 作 : 

1. 保留 程序 单位 当前 的 执行 状态 。 

2. 传递 参数 。 


笑 现 子 程序 


3. 将 返回 地 址 传递 给 被 调用 的 程序 。 
4. 将 控制 转移 给 被 调用 的 程序 。 
从 简单 子 程序 返回 的 语义 要 求 有 下 面 的 动作 : 


1. 如 采 存 在 按 值 与 结果 传递 的 参数 ， 或 者 是 输出 型 的 参数 ， 将 这 些 参数 的 当前 值 转移 到 对 


应 实 参 上 。 
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2. 如 果子 程序 是 一 个 函数 ， 将 函数 值 转 移 到 调用 程序 可 以 存 取 的 位 置 。 


3. 恢复 调用 程序 的 执行 状态 。 

4. 将 控制 转 回调 用 程序 。 

调用 与 返回 动作 要 求 有 空间 来 存储 以 下 信息 : 
。 关 于 调用 程序 的 状态 信息 。 

* 参数 。 

。 返 回 的 地 址 。 

。 国 数 子 程序 的 函数 值 。 


所 有 这 些 连同 局 部 变量 以 及 子 程序 的 代码 一 起 ， 形 成 了 一 套子 程序 执行 及 在 执行 后 返回 控 


制 给 调用 程序 所 需要 的 全 部 信息 。 

一 个 简单 的 子 程序 包括 两 个 分 开 的 部 分 : 子 程序 的 
实际 代码 〈 这 是 不 变 部 分 ) ， 以 及 局 部 变量 和 上 面 所 列 
举 的 数据 (这 个 部 分 在 子 程序 的 执行 中 是 可 以 改变 的 )。 
而 在 简单 子 程序 的 情形 下 ， 这 两 个 部 分 的 大 小 都 是 不 
会 改变 的 。 

子 程序 中 的 非 代 码 部 分 的 格式 (或 布局 ) 被 称 为 活 
动 记 录 ， 因 为 这 一 部 分 仅仅 描述 子 程序 的 活动 期 间或 
执行 期 间 的 有 关 数 据 。 活 动 记录 的 形式 是 静态 的 。 一 
个 活动 记录 实例 是 活动 记录 的 一 个 具体 示例 ， 它 是 活 
动 记录 形式 的 一 组 数据 。 

因为 仅 有 简单 子 程序 的 语言 不 支持 递归 ， 所 以 在 
某 一 个 时 刻 ， 给 定 的 子 程序 只 能 够 有 一 个 活跃 版 本 。 
因此 ， 只 可 能 存在 一 个 子 程序 活动 记录 的 单个 实例 。 
图 10-1 显 示 了 活动 记录 的 一 种 可 能 格式 。 在 这 个 图 中 ， 
我 们 省 略 了 被 保留 的 调用 程序 的 执行 状态 。 因 为 这 种 
状态 十 分 简单 ， 并 且 与 我 们 的 讨论 没有 关联 。 

因为 简单 子 程序 的 活动 记录 实例 具有 固定 的 大 小 ， 
因此 它 可 以 被 静态 地 分 配 存 储 空间 。 事 实 上， 可 以 将 
这 个 活动 记录 实例 附 在 子 程序 的 代码 部 分 中 。 

图 10-2 显 示 一 个 程序 ， 它 包括 了 一 个 主 程序 以 及 三 
个 子 程序 : A、B 和 C。 虽 然 在 图 10-2 中 ， 所 有 的 代码 段 
与 活动 记录 实例 是 分 开 的 ， 但 在 某 些 情况 下 ， 可 以 将 
这 些 活动 记录 实例 附 于 与 它们 相关 联 的 代码 上 。 

图 10-2 中 显示 的 完整 的 程序 构造 并 不 是 全 部 由 编译 
器 来 完成 。 事 实 上 ， 因 为 有 独立 编译 ， 这 四 个 程序 单 
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10-2 一 个 具有 简单 子 程序 的 程序 代码 
及 活动 记录 
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一 个 程序 单位 时 ， 它 的 机 器 码 连 同一 组 对 外 部 子 程序 的 引用 都 被 写 入 一 个 文件 中 。 图 10-2 中 显 
示 的 可 执行 程序 通过 操作 系统 的 连接 器 被 连接 起 来 《有 时 ， 也 将 连接 器 称 为 装载 器 (loader), 
装载 与 连接 器 (loader/ linker) 或 者 连接 编辑 器 (link editor) ) 。 当 调用 连接 器 来 连接 一 个 主 程 
序 时 ， 它 的 第 一 项 任务 是 要 找到 在 程序 中 引用 的 被 翻译 了 的 子 程序 文件 ， 连 同 它们 的 活动 记录 
实例 ， 并 且 将 这 些 载 和 存储器。 然后 ， 连 接 器 必须 将 所 有 对 主 程 序 中 子 程 序 调用 的 目标 地 址 设 
置 为 这 些 子 程序 的 入 口 地 址 。 连 接 器 还 必须 对 所 有 装载 子 程序 中 的 子 程序 调用 以 及 所 有 的 库 子 
程序 调用 进行 同样 的 工作 。 在 前 面 的 例子 中 ， 是 由 这 种 连接 器 来 调用 主 程序 MAIN。 连 接 器 还 必 
须 找到 A，B 和 Cc 的 机 器 码 程序 ， 连 同 它们 的 活动 记录 实例 ， 并 且 将 它们 与 MAIN 的 代码 一 起 载 入 
存储 帮 。 然 后 ， 连 接 器 还 必须 设置 所 有 对 A，B 和 Cc 调用 的 目标 地 址 ， dn Mies ic 
MAIN 中 对 库 子 程序 调用 的 目标 地 址 。 


10.3 实现 具有 栈 动态 局 部 变量 的 子 程序 


现在 来 研究 如 何在 具有 栈 动态 局 部 变量 的 语言 中 实现 子 程序 的 连接 ， 并 且 再 次 将 注意 力 集 
中 在 调用 与 返回 操作 上 。 

栈 动态 局 部 变量 的 一 个 最 重要 的 优点 是 支持 递归 。 因 而 ， 具 有 栈 动 态 局 部 变量 的 语言 也 支 
FPI. 

BATE BRE TETA is EB E HE JS B10 A. 


10.3.1 更 复杂 的 活动 记录 


在 具有 栈 动 态 局 部 变量 的 语言 中 的 子 程序 连接 比 在 简单 子 程序 的 子 程序 连接 更 为 复杂 ， 主 
要 有 如 下 理由 : 

© 编译 如 必 须 为 局 部 变量 的 隐 式 存储 空间 分 配 和 解除 分 配 产生 代码 。 

“递归 增加 了 一 个 子 程序 同时 有 多 个 活动 的 可 能 性 ， 这 意味 着 在 同一 时 刻 可 能 有 一 个 子 程 

序 的 多 个 实例 (未 完成 的 执行 )， 其 中 的 一 个 调用 是 子 程序 的 外 部 调用 ， 另 外 的 一 个 或 多 

个 调用 则 是 递归 调用 。 因 此 ， 递 归 要 求 有 活动 记录 的 多 个 实例 ， 每 一 个 实例 对 应 于 子 程 

序 的 一 个 活动 ， 而 这 些 实例 可 以 同时 存在 。 每 一 个 活动 都 需要 有 自己 的 形 参 的 副本 ， 以 

及 被 动态 分 配 了 空间 的 局 部 变量 ， 连 同 返 回 的 地 址 。 

在 大 多 数 语言 中 ， 一 个 给 定子 程序 的 活动 记录 的 格式 可 以 在 编译 时 知道 。 在 许多 情况 下 ， 
活动 记录 的 大 小 也 是 已 知 的 ， 因 为 所 有 的 局 部 数据 都 是 固 
定 大 小 的 。 但 在 有 些 语言 中 ， 例 如 Ada 语 言 ， 就 不 是 这 样 
的 情形 。 在 这 些 语言 中 ， 一 个 局 部 数组 的 大 小 可 能 取决 于 
茶 一 个 实 参 的 数值 。 在 这 种 情况 下 ， 活 动 记 录 的 格式 虽然 
古 静 态 的 ， 但 它 的 大 小 却 可 能 是 动态 的 。 在 具有 栈 动态 局 
部 变量 的 语言 中 ， 就 必须 动态 地 产生 活动 记录 的 实例 。 图 


栈 顶 





10-3 显 示 了 这 样 一 种 语言 的 典型 的 活动 记录 。 110-3 一 种 具有 栈 动态 局 部 变量 的 
因为 调用 程序 将 返回 地 址 、 动 态 连接 以 及 参数 都 放置 语言 的 典型 活动 记录 


于 活动 记录 实例 中 ， 所 以 这 些 项 必须 首先 出 现 。 

返回 地 址 通常 包括 了 一 个 指向 指令 的 指针 ， 访 指令 后 接着 在 调用 程序 单元 的 代码 段 中 的 调 
用 。 动 态 连接 是 一 个 指向 调用 程序 活动 记录 实例 顶端 的 指针 。 在 静态 作用 域 的 语言 中 ， 当 完成 
了 程序 的 执行 之 后 ， 使 用 这 种 连接 来 删除 当前 的 活动 记录 实例 。 栈 顶 被 设置 为 前 一 个 动态 连接 
的 值 。 之 所 以 要 求 动态 连接 ， 是 因为 在 某 些 情况 下 ， 一 个 子 程序 从 栈 里 分 配 到 的 空间 会 超出 活 


297 


MFA. | 
FAPEP 297 


动 记录 的 范围 。 例 如 ， 这 个 子 程序 的 机 器 语言 版 本 需要 临时 的 空间 ， 就 可 能 在 那里 进行 分 配 。 
因此 ， 虽 然 已 经 知道 活动 记录 的 大 小 ， 但 不 能 够 将 这 种 大 小 简单 地 从 栈 顶 的 指针 上 减 掉 ， 从 而 
删除 活动 记录 。 活 动 记录 中 的 实 参 是 调用 程序 所 提供 的 值 或 地 址 。 

局 部 数量 变量 被 绑 定 于 一 个 活动 记录 实例 范围 之 内 的 存储 空间 。 结 构 化 的 局 部 变量 则 有 时 
和 在 在 别处 被 分 配 ， 只 有 这 些 变量 的 描述 符 以 及 指向 它们 的 存储 区 域 的 指针 是 活动 记录 中 的 一 部 
分 。 局 部 变量 在 被 调用 的 子 程序 中 被 分 配 ， 并 且 可 能 在 被 调用 的 子 程序 中 施行 初始 化 ; 因而 它 

















们 是 在 最 后 出 现 。 
考虑 下 面 的 C 函 数 框架 ， ae |en 
void sub(float total, int part) { | eae [4] 
eae O BR uso 
图 10-4 显 示 了 函数 sub 的 活动 记录 。 TNE i 
启动 一 个 子 程序 ， 需 要 动态 地 产生 这 个 子 程序 的 活动 记录 | 
实例 。 如 前 所 述 ， 活 动 记录 的 格式 在 编译 时 被 国定 ， 而 活动 记 ve 
录 的 大 小 可 能 取决 于 调用 。 因 为 调用 与 返回 的 语义 说 明 应 该 首 | ak | totes 
先 执 行 最 后 被 调用 的 子 程序 ， 由 此 在 栈 上 产生 这 些 活动 记录 的 。 |、 mame | 


实例 就 十 分 合理 。 栈 是 运行 时 系统 的 一 部 分 ， 因 此 我 们 将 它 称 
为 运行 时 栈 (run-time stack)， 但 通常 我 们 仅 称 它 为 栈 。 子 程序 


的 每 一 种 活动 ， 不 论 是 递归 还 是 非 递 归 活 动 ， 都 将 在 栈 上 产生 图 10-4 函数 sub 的 活动 记录 


程序 时 ， 当 前 EP 和 其 他 执行 状态 信息 一 起 存储 在 新 活动 记录 实例 中 。 然后 把 EP 设置 为 指向 新 活 
动 记录 的 基 址 。 根 据 了 程序 的 返回 信息 ， 丛 完成 执行 操作 的 子 程序 的 活动 记录 实例 中 恢复 EP。 
注意 ， 当 前 使 用 的 EP 不 是 存储 在 运行 时 栈 中 ， 只 有 保存 形式 存储 在 活动 记录 实例 中 。 因为 
这 种 保存 形式 与 其 他 执行 状态 信息 存储 在 一 起 ， 因 此 存储 EP 没有 在 运行 时 栈 的 图 中 示 出 ， 
第 9 章 中 曾经 谈 到 ， 一 个 子 程序 从 被 调用 的 时 刻 开始 到 执行 完成 之 时 ， 这 段 期 间 是 活动 的 
(active)。 当 子 程序 不 再 活动 时 ， 它 的 局 部 作用 域 也 就 不 再 存在 ， 它 的 引用 环境 也 不 再 具有 意义 。 
因而 到 了 这 个 时 刻 ， 就 可 以 删除 掉 这 个 子 程序 的 活动 记录 实例 。 


10.3.2 一 个 不 具有 递归 的 例子 
考虑 下 面 的 C 程 序 框架 : 


void funl(float r) { 
int s, t; 
ree <— l] 
fun2 (s); 
} 


void fun2(int x) { 

int y; 
TT < 一 2 
fun3(y); 
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} 


void fun3(int q) { 
‘ea See 8 


} 


void main() { 
float p; 


fani (pis 
2 j 
在 这 个 程序 中 ， 函 数 调 用 的 顺序 为 


main 调 用 fun1l 
funl 调 用 fun2 
fun2 调 用 fun3 


图 10-5 显 示 了 在 被 标记 为 1、2 和 3 的 位 置 处 栈 中 内 容 。 
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返回 (到 main) 
main 的 ARI{ | ”局 部 变量 |p 局 部 变量 





ARI 代 表 活 动 记录 实例 
图 10-5 程序 中 3 个 位 置 的 栈 中 内 容 


在 标记 为 1 的 位 置 ， 在 栈 上 只 有 程序 main 和 函数 fun1 的 活动 记录 实例 。 当 fun1 调 用 fun2 
时 ， 栈 上 产生 了 fun2 的 活动 记录 的 一 个 实例 。 当 fun2 调 用 fun3 时 ， 栈 上 又 产生 了 fun3 的 活 
动 记录 的 一 个 实例 。 当 fun3 的 执行 结束 时 ， 它 的 活动 记录 实例 则 被 从 栈 上 删除 ， 此 时 还 将 使 用 
动态 连接 来 重新 设置 栈 顶 的 指针 。 当 函数 fun1 和 fun2 结 束 时 ， 也 将 发 生 类 似 的 过 程 。 当 在 
main 中 对 fun1 的 调用 返回 之 后 ， 栈 上 只 有 main 的 活动 记录 实例 。 注 意 ， 有 些 实现 对 主 程序 实 
际 上 并 不 使 用 图 10-5 中 所 示 的 栈 上 的 活动 记录 实例 。 然 而 它 也 可 以 这 样 做 ， 这 样 可 以 使 程序 的 
实现 和 我 们 的 讨论 都 简单 化 。 在 这 个 例子 以 及 本 章 所 有 其 他 例子 中 ， 我 们 假设 栈 从 比较 低 的 地 
址 往 比较 高 的 地 址 增长 ， 尽 管 在 一 个 特 列 实现 中 ， 栈 可 能 会 反 向 增长 。 

在 给 定 的 时 刻 出 现在 栈 中 的 一 组 动态 连接 被 称 为 动态 链 或 者 调用 链 。 它 代表 执行 是 怎样 到 
达 当 前 位 置 的 一 个 动态 的 经 历 ， 这 个 当前 位 置 总 是 在 活动 记录 实例 位 于 栈 顶 的 程序 代码 中 。 可 
以 在 代码 中 将 对 局 部 变量 的 引用 表示 为 从 局 部 作用 域 中 的 活动 记录 开始 的 偏 移 。 这 种 偏 移 被 称 
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为 局 部 偏 移 (local_offset ) 。 

通过 使 用 与 活动 记录 相关 的 子 程序 中 所 声明 变量 的 次 序 、 类 型 以 及 大 小 ， 可 以 在 编译 时 确 
定 一 个 变量 在 活动 记录 中 的 局 部 偏 移 。 为 了 简化 这 种 讨论 ， 我 们 假设 所 有 的 变量 都 在 活动 记录 
中 占据 一 个 位 置 。 在 一 个 子 程序 中 声明 的 第 一 个 变量 在 活动 记录 中 被 分 配 的 位 置 是 从 记录 底部 
往 上 第 三 个 位 置 (前 两 个 位 置 为 返回 地 址 和 动态 连接 ) 再 加 上 参数 的 数目 。 所 声明 的 第 二 个 局 
部 变量 在 活动 记录 中 的 位 置 继续 往 栈 顶 靠近 一 个 位 置 ， 依 此 类 推 。 例 如 ， 再 次 考虑 前 面 的 程序 
例子 。 在 fun1 中 Y 的 局 部 偏 移 是 3，t 是 4 的 局 部 偏 移 ， 类 似 地 ， 在 fun2 中 Y 的 局 部 偏 移 是 3。 为 
了 得 到 任何 局 部 变量 的 地 址 ， 变 量 的 局 部 偏 移 加 入 到 EP 中 ， 


10.3.3 递归 
考虑 下 面 的 C 程 序 例子 ， 这 个 程序 使 用 递归 来 计算 阶乘 函数 ， 


int factorial(int n) { 
< 
if (n <= 1) 
return 1; 
else return (n * factorial(n - 1)); 
<——___—__—_____2 
} 
void main() { 
int value; 
value = factorial(3); 
; et sana 图 10-6 国 数 factorial 的 活动 记录 


图 10-6 显 示 了 函数 factorial 的 活动 记录 的 格式 。 注意， 它 有 一 个 用 于 函数 返回 值 的 额外 项 。 
图 10-7 显 示 三 次 执行 到 达 函 数 factorial 中 位 置 1 时 栈 中 的 内 容 。 每 一 个 都 显示 了 这 个 函数 的 
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的 第 一 个 ARI 动态 链接 
”返回 (到 main) 栈 顶 
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返回 (#| factorial) 
栈 顶 
factorial 参数 
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factorial | 动态 链接 E 
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函数 什 
factorial 参数 
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第 一 人 动态 链接 返回 (到 main) l 
i% fel (到 main) main 的 ARI { 局 部 变量 Value 
main 的 ARI { 局 部 变量 value 
第 三 次 调用 


第 二 次 调用 ARI 代 表 活 动 记录 实例 
图 10-7 函数 factorial 中 位 置 1 的 栈 中 内 容 
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又 一 次 活动 ， 而 它 的 函数 值 并 没有 定义 。 第 一 个 活动 记录 实例 具有 返回 给 调用 函数 main 的 一 个 地 
址 。 另 外 的 两 个 各 具有 返回 给 函数 自身 的 一 个 地 址 ， 这 些 地 址 是 用 于 递归 调用 的 。 

图 10-8 显 示 三 次 执行 到 达 函 数 factorial 中 位 置 2 时 栈 中 的 内 容 。 位 置 2 指 的 是 在 执行 了 
return 之 后 ,但 是 在 活动 记录 被 从 栈 上 删除 之 前 的 这 一 时 刻 。 前 面 讲 过 ， 函 数 的 代码 将 参数 n 的 
当前 值 乘 以 函数 的 递归 调用 所 返回 的 值 。 从 factorial 中 第 一 次 返回 的 值 为 1。 这 次 活动 的 活动 
记录 实例 以 值 1 作为 它 的 参数 n 的 版 本 。 这 次 乘法 的 结果 1 再 被 返回 给 factorial 的 第 二 次 活动 ， 
以 便 与 它 的 参数 n 的 值 2 相 乘 。 这 次 的 返回 值 2 返 回 给 factorial 的 第 一 次 活动 ， 以 便 与 它 的 参数 
n 的 值 3 相 乘 ， 产 生 最 后 函数 值 6， 然 后 将 这 个 值 返 回 给 main 中 对 factorial 的 第 一 次 调用 。 
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图 10-8 main 和 factorial 执 行 期 间 的 栈 中 内 容 
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10.4.1 基础 | 
在 具有 航 套 子 程序 的 静态 作用 域 语 言 中 ， 需 要 一 种 具有 两 个 步骤 的 存 取 过 程 来 引用 非 局 部 
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的 变量 。 所 有 能 够 被 非 局 部 访问 的 变量 都 已 经 存放 在 已 有 的 活动 记录 实例 中 ， 也 就 是 位 于 栈 中 
的 茶 一 位 置 。 存 取 过 程 的 第 一 个 步骤 是 在 栈 中 找到 变量 被 分 配 其 中 的 那个 活动 记录 实例 。 第 二 
个 步骤 是 使 用 这 个 变量 的 局 部 偏 移 (在 活动 记录 实例 内 ) 进行 存 取 。 

找到 正确 的 活动 记录 实例 ， 是 这 两 个 步骤 中 较 有 趣 也 是 较 困 难 的 一 步 。 首 先 要 注意 到 ， 在 
一 个 给 定 的 子 程序 中 ， 只 有 在 静态 前 辈 的 作用 域 中 声明 的 变量 才 是 可 见 的 ， 才 能 够 被 存 取 。 除 
此 而 外 ， 当 通过 一 个 嵌 套 子 程序 引用 这 些 变量 时 ， 所 有 这 些 静 态 前 非 们 的 活动 记录 实例 总 是 被 
存放 于 栈 之 上 。 这 由 静态 作用 域 语言 的 静态 语义 规则 保证 ， 即 ， 一 个 子 程序 是 可 以 被 调用 的 ， 
仅 当 这 个 子 程序 的 所 有 静态 前 辈 程序 单位 都 是 活跃 的 。 如 果 某 个 特别 的 静态 前 辈 是 非 活跃 的 ， 
它 的 局 部 变量 将 不 会 被 绑 定 到 存储 空间 ， 因 而 无 法 对 这 些 变量 进行 存 取 。 

非 局 部 引用 的 语义 规定 : 当 在 一 个 包含 作用 域 中 进行 搜寻 时 ， 从 最 靠 内 的 舱 套 子 程序 开始 
癌 外 查找， 这 样 找到 的 第 一 个 声明 就 是 正确 说 明 。 因 而 为 了 支持 非 局 部 引用 ， 必 须 有 可 能 在 栈 
中 找到 对 应 于 静态 前 辈 们 的 所 有 活动 记录 实例 。 这 就 导致 了 下 面 所 述 的 这 种 方法 。 

任 10.5 市 之 前 ， 我 们 将 不 讨论 块 的 问题 ， 因 而 在 本 节余 下 部 分 ， 所 有 的 作用 域 都 是 由 子 程 
序 定义 的 。 因 为 在 基于 C 的 语言 中 函数 是 不 能 被 颈 套 的 〈 只 能 够 通过 块 产生 这 些 语 言 的 静态 作 
用 域 ;， 因 而 在 这 一 节 的 讨论 里 将 不 包括 这 些 语言 。 


10.4.2 静态 链 


在 一 种 允许 嵌 套 子 程序 的 语言 中 ， 实 现 静态 作用 域 的 最 常用 方式 是 静态 链 。 使 用 这 种 方式 
时 ， 将 一 个 被 称 为 静态 连接 的 新 指针 附加 到 活动 记录 中 。 静 态 链接 有 时 也 被 称 为 静态 作用 域 指 
针 ， 它 指 内 静态 父辈 活动 的 活动 记录 实例 的 低层 。 静 态 连接 被 用 来 存 取 非 局 部 变量 。 典 型 地 ， 
静态 连接 在 活动 记录 中 出 现在 参数 所 在 的 位 置 下 面 。 静 态 连 接 添 加 到 活动 记录 中 以 后 ， 要 求 局 
部 侦 移 比 在 静态 连接 没有 加 入 时 要 有 所 不 同 。 在 活动 记录 中 位 于 参数 之 前 的 位 置 就 有 了 三 个 元 
素 ， 而 不 是 像 以 前 只 有 两 个 元 素 ， 它 们 现在 是 : 返回 地 址 、 静 态 连 接 以 及 动态 连接 。 

静态 链 是 栈 中 活动 记录 实例 的 静态 连接 的 一 个 链 。 在 执行 过 程 P 的 期 间 ， 过 程 P 的 活动 记录 
实例 的 静态 连接 将 指向 P 的 静态 父辈 程序 单位 的 活动 记录 实例 。 如 果 过 程 P 的 祖父 辈 的 活动 记录 
实例 存在 ， 静 态 父辈 程序 单位 的 活动 记录 实例 的 静态 连接 将 转 而 指向 这 个 实例 。 因 而 ， 静 态 链 


域 语言 中 实现 非 局 部 变量 的 存 取 。 

使 用 静态 链 找 出 正确 的 非 局 部 变量 活动 记录 实例 是 相对 容易 的 。 当 引用 一 个 非 局 部 变量 上 
可 以 通过 搜索 静态 链 来 寻找 包含 这 个 变量 的 活动 记录 实例 ， 这 种 搜索 将 一 直 进 行 到 发 现 一 个 静 
仿 前 磋 的 活动 记录 实例 包含 了 这 个 变量 为 止 。 然 而 ， 在 实际 上 可 以 比 这 还 容易 。 因 为 在 编译 时 
就 已 经 知道 了 作用 域 的 仍 套 ， 所 以 编译 器 不 但 可 以 确定 一 个 引用 是 否 为 非 局 部 的 ， 还 可 以 确定 
到 达 包 含 这 个 非 局 部 变量 的 活动 记录 实例 所 需 的 静态 链 长 度 。 

设 静 态 深度 (static_depth) 为 一 个 与 静态 作用 域 相 关 的 整数 ， 它 表示 一 个 作用 域 从 最 外 层 
作用 域 开始 所 嵌 套 的 深度 。Ada 主 程序 具有 的 静态 深度 为 0。 如 果 过 程 A 是 定义 于 主 程序 中 的 唯 
一 过 程 ， 则 A 的 静态 深度 为 1!。 如 果 过 程 A 又 包括 了 风 套 过 程 B 的 定义 ， 那 么 B 的 静态 深度 为 2， 

在 对 变量 x 的 非 局 部 引用 中 ， 达 到 正确 的 活动 记录 实例 所 需要 的 静态 链 长 度 ， 正 好 是 包含 x 
?引用 的 过 程 的 静态 深度 与 包含 x 声 明 的 过 程 的 静态 深度 之 差 。 这 个 差 被 称 为 引用 的 和 套 深度 
(nesting_depth) 或 者 链 偏 移 (chain_offset), 。 可 以 将 实际 的 引用 表示 为 一 个 整数 的 有 序 对 (BE 
miS, JOR) ， 在 这 里 ， 链 偏 移 是 到 正确 的 活动 记录 实例 的 连接 数目 (局 部 偏 移 将 在 第 
10.32 证 中 描述 )。 例 如 ， 考 虑 下 面 的 程序 框架 .: 
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procedure A is 
procedure B is 
procedure C is 


end; -- of C 
end; -- of B 
end; -- of A 


RAR，B 和 C 的 静态 次 度 分 别 为 0、1 和 2。 如 果 过 程 C 引 用 一 个 在 A 中 声明 的 变量 ， 这 个 引用 的 链 
偏 移 将 会 是 2(c 的 静态 深度 减 去 A 的 静态 深度 )。 如 果 过 程 cC 引 用 一 个 在 B 中 声明 的 变量 ， 这 个 引 
用 的 链 偏 移 将 会 是 1。 可 以 使 用 同样 的 机 制 来 处 理 对 局 部 变量 的 引用 ， 这 种 引用 的 链 偏 移 为 零 。 
Main_2 用 于 说 明 非 局 部 存 取 的 完整 过 程 ， 考 虑 下 面 的 Ada 程 序 框架 : 
procedure Main 2 is 
X : Integer; 
procedure Bigsub is 
A, B, C : Integer; 
procedure Subl is 
A, D : Integer; 


begin -- Subl 开始 
At B+ Ci See 
end; -- Subl 结束 


procedure Sub2(X : Integer) is 
B, E : Integer; 
procedure Sub3 is 
C, E : Integer; 


begin -- Sub3 开始 
Subl; 
E ra +A; GC 
end; -- Sub3 结束 
begin -- Sub2 开始 
Sub3; 
A:=D+t+E; <3 
end; -- Sub2 结束 
begin -- Bigsub 开始 


Sub2 (7); 


end; -- Bigsub 结束 
begin -- Main 2 开始 
Bigsub; 
end; -- Main 2 结束 


在 这 里 ， 过 程 调用 顺序 是 
Main 2 调用 Bigsub 
Bigsub 调用 Sub2 

Sub2 调用 Sub3 
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Sub3 调用 Subl 


图 10-9 显 示 了 当 执 行 首次 到 达 位 置 1 时 ， 栈 中 的 情形 。 
在 程序 Sub1 中 的 位 置 1， 引 用 的 是 局 部 变量 A， 
而 不 是 Bigsub 中 的 非 局 部 变量 A。 这 个 对 A 的 引用 
具有 和 链 偏 移 /局 部 偏 移 对 (0，3)。 对 B 的 引用 是 对 
来 自 Bigsub 中 的 非 局 部 变量 B 的 引用 。 这 个 引用 可 subl 的 ARI 


以 由 偏 移 对 (1，4) 来 表示 。 它 的 局 部 偏 移 为 4， 
因为 一 个 为 3 的 偏 移 将 会 是 第 一 个 局 部 变量 的 偏 移 


(Bigsub 不 具有 参数 )。 请 注意 ， 如 果 使 用 动态 连 
接 简单 地 搜索 一 个 具有 变量 B 的 声明 的 活动 记录 实 
例 ， 将 会 找到 在 Sub2 中 声明 的 变量 B， 这 是 不 正确 
的 。 如 果 对 偏 移 对 (1, 4) 用 于 这 个 动态 链 ， 就 会 
使 用 Sub3 中 的 变量 BE。 然 而 ， 静 态 连接 指向 
Bigsub 的 活动 记录 ， 这 个 活动 记录 中 具有 B 的 正确 
版 本 。 此 时 ，Sub2 中 的 变量 B 并 没有 在 引用 环境 中 ， i 


sub3 的 ARI 


而 且 是 不 能 够 被 (正确 地 ) 存 取 的 。 在 位 置 1 对 Cc 的 
引用 是 对 在 Bigsub 中 定义 的 c 的 引用 ， 这 由 偏 移 对 
(1, 5) 表示 。 返回 (到 Bigsub) 

在 Sub1 执 行 完 毕 之 后 ，Sub1 的 活动 记录 实例 
被 从 栈 中 删除 ， 控 制 也 将 返回 到 Sub3。 在 Sub3 中 
的 位 置 2 对 sub3 中 变量 E 的 引用 是 局 部 的 ， 并 将 使 ”Bigsub 的 ARI 
用 偏 移 对 (0，4) 来 存 取 。 对 变量 B 的 引用 是 对 在 
Sub2 中 声明 的 B 的 引用 ， 因 为 Sub2 是 包含 了 这 种 返回 ( 
声明 的 最 接近 的 静态 前 辈 。 这 通过 使 用 偏 移 对 (1， main 2 的 ARI 
4) 来 存 取 。 其 中 的 局 部 偏 移 为 4， 是 因为 B 是 在 ARI 代 表 活动 记录 实例 
Sub1 中 声明 的 第 一 个 变量 ， 并 且 Sub2 具 有 一 个 参 2 or 
数 。 对 变量 A 的 引用 是 对 在 Bigsub 中 声明 的 A 的 引 C09 Main MLR 
用 ， 因 为 Sub3 及 其 静态 父辈 Sub2 都 没有 包含 变量 &A 的 声明 。 这 通过 使 用 偏 移 对 (2, 3) 进行 
SIA. 

在 Sub3 执 行 完 毕 以 后 ，Sub3 的 活动 记录 实例 被 从 栈 中 删除 ， 只 留 下 了 Main 2, Bigsub 
以 及 Sub2 的 活动 记录 实例 。 在 Sub2 中 的 位 置 3 对 变量 A 的 引用 是 对 Bigsub 中 A 的 引用 ， 在 活动 
的 子 程序 中 只 有 它 包含 了 变量 A 的 声明 。 这 通过 使 用 偏 移 对 (1, 3) 进行 存 取 。 在 这 个 位 置 上 
设 有 可 见 的 作用 域 包 含 了 变量 D 的 声明 ， 因 而 这 个 对 D 的 引用 是 一 个 静态 语义 错误 。 当 编译 器 在 
企图 计算 链 偏 移 与 局 部 偏 移 对 时 ， 能 够 检查 出 这 个 错误 。 对 变量 E 的 引用 即 是 对 在 Sub2 中 E 的 
引用 ， 可 以 使 用 偏 移 对 (0，5) 进行 存 取 。 

总 之 ， 在 位 置 1、2 和 3 对 变量 A 的 引用 ， 可 由 下 面 这 些 项 表示 ; 

。(0, 3)( 局 部 ) 

e (2, 3)( 两 层 以 外 ) 

。(1, 3)( 一 层 以 外 ) 

此 刻 有 理由 提出 疑问 ， 在 程序 执行 期 间 如 何 维护 静态 链 ? 如 果 这 种 维护 过 于 复杂 的 话 ， 静 
态 链 所 具有 的 简单 性 和 高 效率 就 变 得 不 那么 重要 了 。 在 这 里 我 们 假设 ， 没 有 实现 是 子 程序 名 的 
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对 子 程序 的 每 一 次 调用 和 返回 都 必须 修改 静态 链 。 返 回 部 分 倒是 相当 简单 : 当 子 程序 结束 
时 ， 将 它 的 活动 记录 实例 从 栈 上 删除 。 删 除 后 的 新 的 栈 顶 活动 记录 实例 是 调用 刚 结束 的 子 程序 
单位 的 活动 记录 实例 。 因 为 来 自 这 个 活动 记录 实例 的 静态 链 从 来 就 没有 被 改变 ， 所 以 就 如 同 在 
对 其 他 子 程 序 的 调用 之 前 一 样 ， 这 个 静态 链 可 以 一 如 既往 正确 地 工作 ， 因 而 并 不 需要 采取 其 他 
的 行动 。 

在 子 程序 调用 之 时 所 需要 的 行动 则 较为 复杂 。 虽 然 可 以 在 编译 时 十 分 容易 地 确定 正确 的 父 
昔 作 用 域 ， 但 必须 在 调用 时 找到 最 近 的 父辈 作用 域 的 活动 记录 实例 。 可 以 通过 搜索 动态 链 上 的 
活动 记录 实例 ， 直 到 发 现 第 一 个 父辈 的 作用 域 为 止 ， 从 而 完成 这 项 任务 。 然 而 ， 如 果 处 理 过 程 
的 声明 及 引用 完全 像 处 理 变量 的 声明 及 引用 ， 就 可 以 避免 这 种 搜寻 。 如 果 编 译 器 遇 上 了 一 个 子 
程序 的 调用 ， 在 多 项 任务 中 ， 它 将 确定 这 个 被 调用 子 程序 的 声明 所 在 的 子 程序 ， 而 这 个 子 程序 
必定 是 调用 子 程序 的 一 个 静态 前 厘 。 然 后 ， 编 译 器 将 计算 嵌 套 深度 ， 或 者 计算 在 调用 子 程 序 与 
声明 被 调用 子 程 序 的 子 程序 之 间 包 含 作用 域 的 数目 。 这 种 信息 将 被 存储 起 来 ， 在 执行 期 间 可 以 
通过 子 程序 调用 来 访问 。 在 调用 时 ， 被 调用 子 程序 的 活动 记录 实例 的 静态 连接 是 通过 将 调用 子 
程序 的 静态 链 往 下 移动 来 确定 的 ， 往 下 移动 的 连接 数目 等 于 在 编译 时 计算 的 和 骨 套 深度 。 

再 次 芳 虑 程序 Main_2， 以 及 在 图 10-9 中 所 示 的 栈 中 的 情形 。 当 在 Sub3 中 调用 Sub1 时 ， 编 
译 龙 确定 了 Sub3 〈 调 用 过 程 ) 的 衣 套 深度 为 过 程 Bigsub 内 两 个 层次 ，Bigsub 是 声明 被 调用 
过 程 Sub1 的 过 程 。 当 执行 Sub3 中 对 Sub1l 的 调用 时 ， 这 种 信息 被 用 来 为 Sub1 建 立 活 动 记 录 实 
例 的 静态 连接 。 将 这 个 静态 连接 设置 为 指向 一 个 活动 记录 实例 ， 这 个 实例 是 来 自 调 用 过 程 的 活 
动 记录 实例 的 静态 链 中 第 二 个 静态 连接 所 指向 的 实例 。 在 这 个 例子 中 ， 调 用 过 程 是 Sub3， 其 静 
态 连 接 指 癌 它 的 父辈 过 程 (Sub2) 的 活动 记录 实例 。Sub2 的 活动 记录 实例 的 静态 连接 指向 
Bigsub 的 活动 记录 实例 。 因 此 ， 将 Sub1 的 新 的 活动 记录 实例 的 静态 连接 设 为 指向 Bigsub 的 
活动 记录 实例 。 

这 种 方法 适用 于 所 有 的 子 程序 的 连接 ， 涉 及 参数 为 子 程序 名 的 情况 除外 。 

关于 使 用 静态 链 存 取 非 局 部 变量 的 一 种 批评 是 ， 引 用 作用 域 在 静态 父辈 作用 域 之 外 的 变量 ， 
其 代价 十 分 昂贵 。 这 种 静态 链 从 引用 到 声明 ， 必 须 一 个 包含 作用 域 一 个 连接 地 环 环 紧 跟 。 另 一 
种 批评 有 是， 在 编写 对 于 执行 时 间 要 求 很 高 的 程序 时 ， 程 序 人 员 很 难 估计 非 局 部 引用 的 代价 ， 因 
为 每 个 ?| 用 的 代价 取决 于 在 引用 与 声明 作用 域 之 间 的 艇 套 深 度 。 使 得 这 一 问题 更 复杂 的 情况 是 ， 
代码 的 后 续 修改 可 能 会 改变 舱 套 深度 ， 并 由 此 改变 某 些 引 用 的 时 间 。 这 可 以 发 生 在 改变 了 的 代 
码 中 ， 也 可 能 发 生 在 远离 这 种 改变 的 代码 中 。 

现在 已 经 发 展 了 一 些 静 态 链 的 替代 方法 ， 最 著名 的 一 种 方法 是 使 用 称 为 显示 (display) 的 
辅助 数据 结构 。 然 而 ， 没 有 发 现 一 种 可 替代 方法 优 于 静态 链 方法 ， 它 仍然 是 最 广泛 使 用 的 方法 。 
这 里 并 不 讨论 它们 。 


mm, 保持 简单 性 
E NIKLAUS WIRTH 

Niklaus Wirth 在 办 黎 世 的 瑞士 联邦 技术 学 院 开始 了 他 的 工程 生涯 ， 后 来 又 到 加 拿 
大 学 习 ， 此 后 ， 于 1963 年 在 美国 加 州 Berkeley 大 学 获得 博士 学 位 。 他 曾经 是 斯 坦 福 大 
学 和 慕尼黑 大 学 的 计算 机 科学 助理 教授 , 苏黎世 的 瑞士 联邦 技术 学 院 的 计算 机 科学 教 
授 ， 加 州 Xerox PARC 公 司 的 研究 员 。Wirth 教 授 曾 经 获得 IEEE 的 计算 机 先驱 者 奖 。 


EMTEA 305 
0 


“因为 开发 了 一 系列 创新 的 计算 机 语言 EULER, ALGOL-W, PASCAL 和 MODULA”， 他 获得 了 人 ACM 的 
图 灵 奖 。 

关于 设计 与 解决 问题 

问 :Pascal 清晰 一 致 的 结构 设立 了 一 个 新 的 标准 。Pascal 中 的 什么 东西 导致 了 重大 的 改进 ? 

E: 主要 是 Pascal 表 示 了 程序 设计 中 最 基本 的 元 素 ， 并 让 它们 以 一 种 自由 和 通用 的 方式 相 结合 。 就 语 
句 和 数据 方面 而 言 ，Pascal 是 一 种 结构 式 语言 。 

A]: 你 曾经 花费 大 量 时 间 ， 思 考 硬件 和 软件 和 谐 工 作 问 题 的 解决 方案 ，Lilith 计 算 机 与 Oberon 和 
Modula。 在 较 大 型 的 硬件 构架 中 有 关 程 序 设计 工具 的 设计 方面 ， 是 什么 使 你 在 解决 问题 时 将 两 者 放 在 一 起 
考虑 ? 

E: 如 果 计 算 机 体系 结构 和 软件 能 够 很 好 地 构造 ， 并 且 能 够 一 起 和 谐 地 工作 ， 那 么 这 两 者 都 将 变 得 
更 加 简单 和 经 济 。 最 重要 的 是 ， 它 们 将 变 得 更 容易 理解 。 

H: 在 一 篇 关于 你 的 采访 中 ， 我 读 到 了 下 面 的 文字 :“ 一 个 好 的 设计 者 必须 依靠 他 的 经 验 ， 他 的 准确 
的 多 辑 思维 和 他 的 精致 。 像 变 戏 法 那样 是 不 行 的 ”怎样 区 别 变 戏法 与 最 好 的 解决 方法 ”怎么 能 够 将 前 者 
从 后 者 中 除去 ? 

E: 我 想 大 多 数 情况 下 是 通过 经 验 。 有 能 力 进行 这 种 区 分 的 老师 将 是 很 有 帮助 的 。 

P: 在 另 一 次 对 你 的 采访 中 ， 你 提 到 了 今天 的 设计 状况 以 及 设计 的 动力 :“ 用 户 的 愿望 比 需求 更 为 重 
和 要。 相对 于 可 靠 性 和 透明 的 程序 ， 人 们 更 容易 买 那些 具有 很 酷 特 点 的 东西 ， 哪 怕 这 种 东西 很 少 使 用 ” 如 
人 术 事 实 恰恰 相反 ， 你 能 够 想象 今天 一 般 用 户 的 操作 系统 或 万 维 网 的 界面 会 是 什么 样子 ”在 哪些 方面 会 更 好 
一 些 ? 

E: 客户 在 描述 一 个 软件 系统 时 ， 常 常 并 不 准确 地 知道 他 们 到 底 需 要 的 是 什么 。 因此 他 们 的 “愿望 ， 
也 许 并 不 真正 反映 了 他 们 的 需求 。 当 仔细 审阅 时 将 发 现 , 他们 对 一 大 堆 东西 的 说 明 十 分 多 余 ， 至 少 不 重 要 
如 术 能 够 将 力量 集中 在 关键 的 部 分 ， 而 少 搞 那些 花哨 的 东西 ， 就 能 够 设计 出 比较 简单 、 更 经 济 、 比 较 容易 
理解 和 操作 的 健壮 系统 。 

P: 你 表达 过 这 样 的 意见 ， 就 是 科学 技术 能 够 完成 的 事情 常常 被 夸大 了 ， 例如， 人 工 智能 可 以 被 用 
来 制造 能 电 想 ”的 机 器 。 你 能 不 能 解释 一 下 ， 为 什么 相信 这 种 技术 的 夸大 ， 会 将 科学 家 引 向 一 条 一 无 
所 获 的 道路 ? 

E: 对 于 现代 IT 中 很 多 东西 的 炒作 ， 还 不 仅仅 是 人 工 智能 ， 这 些 还 没有 太 多 地 误导 科学 家 ， 被 误导 的 
万 消费 者 和 投资 者 。 支 持 具有 一 定 风险 的 长 期 性 研究 是 一 回 事 ， 推 销 言 过 其 实 的 产品 又 是 另外 一 回 事 . 

最 新 的 发 展 以 及 工具 

H: 回想 在 过 去 的 十 年 间 ， 语 言 特征 中 的 哪些 进展 对 于 开发 更 好 的 语言 作出 了 最 大 的 贡献 ? 

E: 程序 和 数据 的 结构 、 与 断言 相关 的 概念 以 及 循环 不 变 式 ， 模 块 化 设计 以 及 模块 的 分 开 编译 ， 数 
据 类 型 的 层次 (在 面向 对 象 程序 设计 中 ， 被 称 为 具有 继承 的 子 类 ) , 

H: 在 学 生 们 比较 和 学 习 函 数 式 语言 、 逻 辑 语言 、 过 程式 语言 以 及 面向 对 象 程序 设计 语言 时 ， 应 访 
在学 习 和 工作 中 怎样 考虑 过 程式 的 程序 设计 ? 过 程式 程序 设计 已 经 成 为 一 种 历史 风格 了 吗 ?什么 样 的 设计 
将 很 快 成 为 一 种 称心 的 风格 ? 

舍 : 计算 机 科学 专业 的 学 生 应 该 知道 各 种 程序 设计 方式 : 过 程式 的 、 函 数 式 的 、 逻 辑 的 以 及 面向 对 
家 的 。 这 是 十 分 重要 的 。 然 而 明显 的 是 ， 过 程式 的 风格 仍然 最 接近 运行 程序 的 计算 机 。 计 算 机 的 特征 是 具 
有 可 以 被 分 别 修改 的 存储 器 单位 ， 它 们 对 应 于 程序 设计 语言 中 的 变量 。 面 向 对 象 的 风格 就 是 基于 过 程式 风 
备 的 。 虽 然 在 面向 对 象 的 语言 中 ， 将 过 程 称 为 “方法 "， 将 调用 一 个 过 程 称 为 “传送 一 个 消息 ” ， 但 面向 
对 家 只 是 过 程式 的 一 个 变种 ， 并 非 真正 本 质 上 的 不 同 。 我 个 人 认为 ， 函 数 式 程序 设计 以 及 逻辑 程序 设计 是 
称心 的 风格 ”的 程序 设计 ， 而 过 程式 的 程序 设计 不 是 。 
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BSS 


F 
© 


6 


306 第 10 章 





域 ， 它 们 被 称 为 块 (block)。 作 为 块 的 一 个 例子 ， 考 虑 下 面 一 段 C 的 代码 段 : 


{ int temp; 
temp = list[upper]; 
list[upper] = list[lower]; 
list[lower] = temp; 


} 


在 基于 C 的 语言 中 ， 块 为 一 段 代 码 ， 这 段 代 码 开始 于 一 条 或 几 条 数据 定义 ， 并 且 这 些 定义 
包括 在 花 括 号 中 。 上 面 所 示 的 块 中 变量 temp 的 生存 期 从 控制 进入 块 时 开始 ， 到 控制 退出 块 时 终 
止 。 使 用 这 样 一 种 局 部 变量 的 优越 性 在 于 它 不 会 干扰 任何 在 程序 中 其 他 位 置 声明 的 同名 变量 。 

可 以 使 用 我 们 所 描述 的 、 用 于 实现 嵌 套 子 程序 的 静态 链 方法 来 实现 块 。 可 以 将 块 处 理 为 总 
是 从 程序 中 的 同一 位 置 调用 的 无 参数 子 程序 。 因 而 ， 每 一 个 块 都 具有 一 个 活动 记录 。 每 次 执行 
这 个 块 时 ， 就 会 产生 它 的 活动 记录 的 一 个 实例 。 

也 可 以 使 用 不 同 的、 略为 简单 然而 更 有 效率 的 方式 来 实现 块 。 在 程序 执行 中 的 任何 时 刻 ， 
块 变量 所 需要 的 最 大 存储 空间 可 以 被 静态 地 确定 ， 因 为 块 的 进入 与 退出 是 严格 按照 文本 顺序 的 。 
可 以 将 块 的 这 些 存 储 空间 分 配 在 活动 记录 中 局 部 变量 的 后 面 。 也 可 以 静态 地 计算 所 有 块 变量 的 
偏 移 ， 因 而 块 变量 就 可 以 完全 像 局 部 变量 那样 被 直接 寻 址 。 

例如 ， 考 虑 下 面 的 程序 框架 ; 


void main() { 
int z; Y; Gi 
while ( ... ) { 
int a, b, C; 
while ( ... ) { 
int d, e; 


} 


对 于 这 个 程序 ， 可 以 使 用 图 10-10 中 的 静态 存储 空间 
格局 。 注 意 E 和 g 占 据 了 相同 的 存储 空间 位 置 ，a 和 b 也 占 
据 了 相同 的 存储 空间 位 置 ， 因 为 当 a 和 b 的 块 被 退出 时 记录 实例 
(在 f£ 和 g 被 分 配 之 前 )，a 和 b 被 从 栈 中 弹出 。 \ W: 


10.6 实现 动态 作用 域 


在 一 种 动态 作用 域 语 言 中 ， 至 少 存在 着 实现 非 局 部 
引用 的 两 种 不 同 的 方式 ， 即 深 访问 和 浅 访问 。 请 注意 ， 
深 访 问 和 收 访 问 的 概念 与 深 绑 定 和 浅 绑 定 的 概念 并 没有 
关联 。 在 这 里 ， 绑 定 与 访问 之 间 的 基本 不 同 是 次 绑 定 和 


浅 绑 定 将 导致 不 同 的 语义 ， 而 深 访 问 和 浅 访问 则 并 不 导 EOT SOA PARR AAS BH 
致 语义 的 不 同 。 过 程 时 ， 块 变量 的 存储 状态 
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如 采 在 一 种 动态 作用 域 的 语言 中 ， 局 部 变量 是 栈 动 态 的 ， 并 且 它 们 是 活动 记录 中 的 一 部 分 ， 
那么 对 非 局 部 变量 的 引用 可 以 通过 搜索 其 他 当前 活动 的 子 程序 的 活动 记录 实例 来 得 以 解决 ， 搜 
案 将 开始 于 最 近 激 活 的 子 程序 。 这 种 概念 类 似 于 ， 在 一 种 使 用 艇 套子 程序 的 静态 作用 域 的 语言 
中 访问 非 局 部 变量 ， 只 是 所 跟踪 的 是 动态 链 而 不 是 静态 链 。 动 态 链 将 所 有 子 程序 活动 记录 实例 
连接 在 一 起 ， 但 是 以 这 些 子 程序 活动 先后 的 反 向 次 序 进 行 连接 。 因 此 ， 动 态 链 恰恰 就 是 在 一 种 
动态 作用 域 的 语言 中 引用 非 局 部 变量 所 需要 的 技术 。 这 种 方法 被 称 为 深 访问 ， 因 为 这 种 访问 可 


能 需要 在 栈 中 深入 地 搜索 。 
考虑 下 面 的 程序 例子 : 
void sub3() { 


int x, Zz; 
x =u + y? 


} 


void sub2() { 
int w, x; 


} 


void subl() { 
int v, w; 


} 


void main() { 
int v, u; 


} 

这 个 程序 的 语法 从 表面 上 看 像 是 一 种 基于 C 的 语言 的 程 
序 ， 但 这 并 不 意味 着 它 是 任何 特定 语言 的 程序 。 假 设 有 下 
面 的 程序 调用 序列 

main 调用 

subl 调用 

subl 调用 
sub2 调用 

图 10-11 显 示 了 在 这 个 调用 序列 之 后 函数 sub3 的 执行 
期 间 栈 中 的 情形 。 请 注意 ， 这 种 活动 记录 实例 没有 静态 连 
接 ， 在 一 种 动态 作用 域 的 语言 中 ， 静 态 连接 没有 用 途 。 

浪 虑 对 函数 sub3 中 变量 x，u 和 v 的 引用 。 对 x 的 引用 
古 在 sub3 的 活动 记录 实例 中 找到 的 。 对 u 的 引用 是 通过 搜 
寻 栈 上 所 有 的 活动 记录 实例 才 最 终 找到 的 ， 因 为 现 有 的 、 
唯一 具有 这 个 名 称 的 变量 是 在 main 中 。 这 种 搜寻 涉及 跟踪 
四 个 动态 连接 ， 以 及 检查 十 个 变量 名 称 。 对 Vv 的 引用 是 在 函 
数 sub1 的 最 近 的 (动态 链 上 最 接近 之 处 ) 活动 记录 实例 中 


subl 
subl 
sub2 
sub3 





局 部 变量 
局 部 变量 
动态 链 
返回 (到 sub2) 
局 部 变量 
局 部 变量 
返回 (到 subl1) 
局 部 变量 

局 部 变量 
返回 (到 sub1) 
局 部 变量 
局 部 变量 


— 








sub3 的 ARI 





sub2 的 ARI 


| 
| 
| 
| 









< = 






subl 的 ARI 


` 
+ 
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& 
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E 
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返回 (到 main) 
局 部 变量 
局 部 变量 
ARI 代 表 活动 记录 实例 
图 10-11 一 个 动态 作用 域 程序 的 栈 
中 的 内 容 
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找到 的 。 

在 动态 作用 域 语言 中 的 非 局 部 引用 的 深 访问 方法 ， 与 在 静态 作用 域 语言 中 的 静态 链 方法 之 
间 ， 存 在 着 两 个 重大 的 差别 。 首 先 ， 在 动态 作用 域 的 语言 中 ， 无 法 在 编译 时 确定 必须 搜索 的 链 
的 长 度 。 然 而 ， 却 必须 搜索 这 个 链 中 的 每 一 个 活动 记录 实例 ， 直 到 找到 了 被 引用 变量 的 第 一 个 
实例 为 止 。 这 就 是 为 什么 动态 作用 域 语 言 的 执行 速度 通常 比 静态 作用 域 语言 的 执行 速度 更 慢 的 
原因 。 其 次 ， 为 了 搜索 ， 在 活动 记录 中 必须 储存 变量 名 ， 而 在 静态 作用 域 语言 的 实现 中 则 只 要 
求 保存 值 。( 静 态 作用 域 不 要 求 变 量 名 ， 因 为 所 有 的 变量 都 由 链 偏 移 与 局 部 偏 移 对 表示 ) 


10.6.2 浅 访 问 


浅 访问 是 一 种 替代 的 实现 方法 ， 而 不 是 一 种 替代 语义 。 如 前 所 述 ， 次 访问 的 语义 与 线 访 问 
的 语义 是 相同 的 。 在 浅 访问 方法 中 ， 并 不 将 在 子 程序 中 声明 的 变量 储存 在 这 个 子 程序 的 活动 记 
录 中 。 因 为 在 动态 作用 域 的 方法 里 ， 任 何 一 个 特定 名 称 的 变量 在 任 一 给 定 的 时 刻 最 多 只 能 有 一 
个 可 见 版 本 ， 因 而 可 以 采取 一 种 非常 不 同 的 方式 。 浅 访问 的 一 种 变化 方式 是 ， 整 个 程序 中 的 每 
一 个 变量 名 都 有 一 个 分 离 的 栈 。 每 当 一 个 子 程序 在 激活 初期 的 声明 中 产生 一 个 特定 名 称 的 新 变 
量 时 ， 便 在 栈 顶 给 这 个 变量 分 配 一 个 装载 它 的 名 字 的 单位 。 对 这 个 名 字 的 每 一 个 引用 ， 即 是 对 
与 这 个 名 字 相 关联 的 、 被 置 于 栈 顶 的 变量 的 引用 ， 这 是 由 于 栈 顶 的 变量 是 最 后 才 创 建 的 。 当 一 
个 子 程序 终止 时 ， 它 的 局 部 变量 的 生存 期 也 就 结束 了 ， 因 而 这 些 变 量 名 的 栈 也 即 被 弹出 。 这 种 
方法 允许 非常 快速 的 变量 引用 ， 但 是 在 子 程序 进入 与 退出 时 ， 栈 的 维护 却 十 分 昂 贯 。 

图 10-12 显 示 的 是 上 面 的 例子 程序 的 变量 栈 ， 这 个 程序 处 于 与 图 10-11 所 示 的 同样 的 情形 。 

实现 浅 访 问 的 另 一 种 选择 方式 是 使 用 一 个 中 央 表 格 。 在 表格 中 列 出 程序 中 每 一 个 不 同 变量 
名 的 位 置 。 将 一 个 被 称 为 活跃 的 位 与 每 一 个 表 项 一 起 来 维护 ， 这 个 活跃 的 位 被 用 来 指示 变量 名 
是 否 具 有 当前 绑 定 ， 或 者 具有 任何 变量 的 关联 。 然 后 ， 就 可 以 将 对 任何 变量 的 任何 访问 表示 为 
表格 中 的 偏 移 。 这 种 偏 移 是 静态 的 ， 因 而 这 种 访问 可 以 十 分 快捷 。SNOBOL 的 实现 使 用 了 中 央 
表格 的 实现 技术 。 






Vv 


( 栈 单元 中 的 名 字 指 变量 声明 的 程序 单元 ) 
图 10-12 一 种 使 用 浅 访问 来 实现 动态 作用 域 的 方法 


维护 中 央 表 格 很 向 单 。 一 个 子 程序 调用 将 要 求 将 它 所 有 的 局 部 变量 合乎 逻辑 地 放置 于 中 央 
表格 中 。 如 果 在 中 央 表 格 中 要 存放 的 新 变量 的 位 置 本 来 就 已 经 是 活跃 的 ， 即 这 个 位 置 包含 了 一 
个 生存 期 还 没有 结束 的 变量 (由 活跃 位 指示 )， 则 这 个 值 必须 在 新 变量 的 生存 期 内 被 保存 在 某 个 
其 他 地 方 。 每 当 有 一 个 变量 开始 它 的 生存 期 ， 都 必须 在 中 央 表 格 中 设置 它 的 活跃 位 。 

中 央 表 格 的 设计 有 几 种 不 同 的 形式 ， 也 有 几 种 不 同 的 方式 来 储存 临时 被 替换 的 值 。 一 种 变 
化 形式 是 使 用 一 个 “隐蔽 ”的 栈 来 保存 所 有 要 被 储存 的 对 象 。 因 为 子 程序 的 调用 与 返回 以 及 由 
此 局 部 变量 的 生存 期 都 是 对 套 的 ， 这 种 表格 形式 就 十 分 适用 。 

第 二 种 变化 形式 实现 起 来 也 许 最 人 简洁， 代价 也 最 低 。 这 种 方法 使 用 一 种 单位 的 中 央 表 格 ， 
仅 储存 每 一 个 变量 名 的 当前 版 本 。 将 被 蔡 换 的 变量 储存 于 产生 这 个 替换 变量 的 子 程 序 的 活动 记 
录 中 。 这 是 一 种 栈 机 制 ， 因 为 已 经 有 一 个 栈 存 在 ， 新 部 分 的 开销 因此 十 分 有 限 。 
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对 于 非 局 部 变量 ， 在 浅 访问 与 深 访问 之 间 的 选择 取决 于 子 程序 调用 以 及 非 局 部 引用 的 相对 
频率 。 深 访问 方法 提供 快速 的 子 程序 连接 ， 但 是 对 非 局 部 变量 的 引用 ， 特 别 是 对 远程 非 局 部 变 
量 (就 调用 链 上 的 距离 而 言 ) 的 引用 ， 代 价 较 高 。 浅 访问 的 方法 提供 了 快 得 多 的 非 局 部 引用 ， 
尤其 是 对 远程 非 局 部 变量 ， 但 是 就 子 程序 连接 方面 而 言 ， 则 代价 较 高 。 


小 结 


子 程序 链接 的 语义 要 求 许多 通过 实现 的 动作 。 在 “简单 ” 子 程序 的 情况 下 ， 这 些 动作 是 相对 简单 的 。 
在 具有 栈 动 态 局 部 变量 以 及 嵌 套 子 程序 的 语言 中 ， 子 程序 的 连接 则 较为 复杂 。 

在 具有 栈 动态 局 部 变量 以 及 嵌 套 子 程序 的 语言 中 ， 子 程序 具有 两 个 组 成 部 分 ， 即 静态 的 实际 代码 以 
及 栈 动态 的 活动 记录 。 活 动 记录 实例 包括 形 参 和 局 部 变量 ， 以 及 其 他 一 些 数 据 。 

静态 链 是 在 具有 嵌 套 子 程序 的 静态 作用 域 的 语言 中 实现 非 局 部 变量 存 取 的 主要 方法 ， 

在 一 种 动态 作用 域 语 言 中 ， 可 以 通过 使 用 动态 链 或 者 中 央 变 量 表格 的 方法 来 实现 对 非 局 部 变量 的 存 
取 。 动 态 链 提供 了 较 慢 的 访问 ,但 却 提供 了 快捷 的 调用 与 返回 。 中 央 表 格 方法 提供 了 快速 的 访问 ， 但 却 提 
供 了 较 慢 的 调用 与 返回 。 


复习 题 

1. 为 什么 实现 具有 栈 动 态 局 部 变量 的 子 程序 比 实现 简单 子 程序 更 为 困难 ? 有 哪 两 条 理由 ? 

2. 活动 记录 与 活动 记录 实例 之 间 有 什么 差别 ? 

3. 为 什么 将 返回 地 址 、 动 态 连接 以 及 参数 放置 在 活动 记录 的 底部 ? 

4. 在 一 种 具有 栈 动态 局 部 变量 和 机 套 子 程序 的 静态 作用 域 语言 中 ， 定 位 一 个 非 局 部 变量 需要 哪 两 个 步 驴 ? 

5. 定义 静 态 链 、 静 态 深度 、 幅 套 深度 和 链 偏 移 。 

6. 表态 链 方法 具有 哪 两 种 潜在 的 问题 ? 

7. 解释 当 使 用 显示 时 ， 怎 样 找到 一 个 对 非 局 部 变量 的 引用 。 

8. 在 静态 链 方 法 中 怎样 表示 变量 的 引用 ? 

9. 解释 实现 块 的 两 种 方法 。 

10. 描述 实现 动态 作用 域 的 深 访问 方法 。 

11. 描述 实现 动态 作用 域 的 浅 访问 方法 。 

12. 在 动态 作用 域 语言 中 ， 进 行 非 局 部 存 取 的 深 访问 方法 ， 与 静态 作用 域 语言 中 的 静态 链 方法 之 间 ， 有 哪 
两 点 不 同 ? 

13. 就 调用 以 及 非 局 部 存 取 这 两 个 方面 ， 比 较 深 访问 方法 与 浅 访 问 方法 的 效率 。 


练习 题 


1. 显示 当 执 行 到 达 下 面 程序 框架 中 的 位 置 1 时 的 栈 , 连同 所 有 的 活动 记录 实例 , 并 且 包 括 静态 链 与 动态 链 ， 
假设 Bigsub 位 于 层次 1。 


procedure Bigsub is 
procedure A is 
procedure B is 
begin -- B 开始 
1 
end; -- B 结束 
procedure C is 
begin -- C 开始 


B; 
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end; -- C 结束 
begin -- A 开始 
C; 
end; -- A 结束 
begin -- Bigsub 开始 
A; 
end; -- Bigsub 结束 


2. 显示 当 执 行 到 达 下 面 程序 框架 中 的 位 置 1 时 的 栈 , 连同 所 有 的 活动 记录 实例 , 并 且 包 括 静 态 链 与 动态 链 。 

假设 Bigsub 位 于 层次 1。 

procedure Bigsub is 
MySum : Float; 
procedure A is 
X : Integer; 

procedure B(Sum : Float) is 
Y, 2 2: Floats 


begin -- B 开始 
C(Z) 
end; -- B 结束 
begin -- A 开始 
B(X); 
end; -- A 结束 
procedure C(Plums : Float) is 
begin -- C 开始 
e <<] 
end; -- C 结束 
L : Float; 
begin -- Bigsub 开 始 
A; 
end; -- Bigsub 结束 


3. 显示 当 执 行 到 达 下 面 程序 框架 中 的 位 置 1 时 的 栈 , 连同 所 有 的 活动 记录 实例 ， 并 且 包 括 静 态 链 与 动态 链 。 
假设 Bigsub 位 于 层次 1。 


procedure Bigsub is 
procedure A(Flag : Boolean) is 
procedure B is 


A( false); 


end: -- B 结束 
begin -- A 结束 
if flag 
then B; 
else C; 
end; -- A 结束 


procedure C is 


人 人 


Un 


N 


ARRETE ooo aaa S 


procedure D is 
。 Se) 


end; --D 结束 
D; 
end; -- C 结束 
begin -- Bigsub 开始 


A(true); 
end; -- Bigsub 结束 
这 个 程序 执行 到 达 D 的 调用 序列 为 : 
Bigsub 调用 A 
A 调用 B 
B 调用 A 
A 调用 c 
C 调用 D 


:显示 当 执 行 到 达 下 面 程序 框架 中 的 位 置 1 时 的 栈 ， 连 同 所 有 的 活动 记录 实例 ， 包 括 动 态 链 。 这 个 程序 使 


用 座 访问 方法 实现 动态 作用 域 。 
void funl() { 
float a; 


} 


void fun2() { 
int b, Ce 467 


} 


void fun3() { 
float d; 
一] 

} 

void main() { 
char e, f, g; 


} 


这 个 程序 的 执行 到 达 fun3 的 调用 序列 为 : 
main 调用 fun2 
fun2 调用 funl 
funl 调用 funl 
funl 调用 fun3 


:假设 练习 题 4 中 的 程序 是 使 用 浅 访 问 来 实现 的 ， 每 个 变量 名 用 一 个 栈 。 显 示 当 执行 到 fun3 时 这 些 栈 的 情 


形 ， 假 设 是 通过 练习 题 4 中 的 调用 序列 到 达 这 个 执行 状态 的 。 


-虽然 每 次 激活 Java 方 法 中 的 局 部 变量 时 ， 都 将 这 些 变量 动态 地 进行 分 配 ， 但 在 什么 样 的 情况 下 ， 某 一 次 


激活 的 局 部 变量 值 可 以 保持 前 一 次 被 激活 的 值 ? 


在 本 章 中 曾经 指出 : 当 使 用 动态 链 在 一 种 动态 作用 域 的 语言 中 存 取 非 局 部 变量 时 ， 必 须 将 变量 名 和 变量 


值 一 同 储存 到 活动 记录 中 。 如 果实 际 开 发 中 将 其 付 诸 实 现 ， 则 每 一 次 对 非 局 部 变量 的 访问 都 会 要 求 一 系 
列 高 代价 的 、 对 名 字 的 字符 串 比 较 。 请 设计 另 一 种 较 快速 的 字符 串 比 较 方法 。 


408 


了 72 第 10 章 





8. Pascal 人 允许 goto 语 句 具 有 非 局 部 的 目标 。 如 果 是 使 用 静态 链 存 取 非 局 部 变量 ,怎样 处 理 这 种 类 型 的 语 
句 ? 提示 : 考虑 寻找 新 近 激 活 过 程 的 静态 父辈 的 正确 活动 记录 实例 (参见 第 10.4.2 市 )。 

9. 可 以 通过 在 每 个 活动 记录 实例 中 使 用 两 个 静态 连接 ， 来 略微 扩展 静态 链 的 方法 ， 其 中 的 第 二 个 静态 连 
接 指 向 静态 祖父 辈 的 活动 记录 实例 。 这 种 扩展 会 对 子 程序 连接 和 非 局 部 引用 所 需 时 间 产 生 什么 影响 ? 

10. 设计 一 个 框架 程序 和 调用 序列 ， 当 静态 链接 和 动态 链接 指向 运行 时 栈 中 的 不 同 的 活动 记录 实例 ， 该 序 


列 产生 活动 记录 实例 。 


第 11 章 ”抽象 数据 类 型 和 封装 结构 


在 这 一 章 里 ， 我 们 研究 程序 设计 语言 中 支持 数据 抽象 的 结构 。 在 过 去 的 45 年 中 ， 在 程序 设 
计 方 法 学 和 程序 设计 语言 设计 的 新 思想 中 ， 数 据 抽 象 是 最 深刻 的 思想 之 一 。 

我 们 将 从 在 程序 设计 和 在 程序 设计 语言 中 的 一 般 抽象 概念 开始 讨论 。 然 后 定义 数据 抽象 并 且 . 
使 用 一 个 例子 来 介绍 这 种 定义 。 接 着 将 摘 述 在 Ada、C++、Java、C# 和 Ruby 中 对 于 数据 抽象 的 支 
持 。 并 且 将 给 出 在 Ada、C++、Java、C# 和 Ruby 语 言 中 实现 同一 数据 抽象 的 例子 ， 以 说 明 在 支持 
数据 抽象 方面 语言 设计 机 制 上 的 相似 性 及 差别 。 接 着 再 讨论 Ada、C++、jJava 5.0 和 C# 2005 语 言 
建立 有 参数 的 抽象 数据 类 型 的 功能 

支持 抽象 数据 类 型 的 结构 是 一 些 封装 ， 它 们 将 数据 以 及 在 这 种 类 型 的 对 象 上 的 操作 封装 在 
一 起 。 大 型 程序 中 的 结构 需要 包括 多 种 类 型 的 封装 。 我 们 将 在 这 一 章 中 讨论 这 种 类 型 的 封装 ， 
以 及 与 这 种 封装 相关 联 的 名 称 空间 。 


11.1 抽象 概念 


抽象 是 对 于 实体 的 一 种 观念 或 者 实体 的 一 种 表示 ， 它 仅仅 包括 这 个 实体 的 最 重要 的 属性 。 
在 一 般 情况 下 ， 抽 象 允 许 人 们 将 实体 的 实例 组 织 成 为 一 些 组 合 ， 在 这 些 组 合 中 不 需要 考虑 它们 
的 共同 属性 。 例 如 ， 假 如 我 们 定义 岛 是 带 有 下 面 属 性 的 动物 : 两 条 腿 、 两 个 翅膀 、 一 条 尾巴 和 
飞行 能 力 。 然 后 如 采 我 们 说 乌鸦 是 乌 ， 那么 对 乌鸦 的 描述 不 需要 包括 这 些 属性 。 对 于 转 (robin), 
及 稚 和 胆 小 的 黄 腹 吸 木 乌 也 是 这 样 。 描 述 鸟 的 特定 种 类 的 这 些 共同 属性 能 被 抽象 出 来 。 而 在 这 
些 组 合 里 ， 只 需要 芳 虑 单个 元 素 间 有 差别 的 属性 。 这 就 大 大 简化 了 组 中 元 素 。 如 果 有 必要 了 解 
更 多 的 细 市 时 ， 就 必须 考虑 这 些 实体 的 较 低 抽象 层次 上 的 表示 。 

在 程序 设计 语言 的 世界 里 ， 抽 象 是 对 抗 程 序 设 计 复杂 性 的 一 种 武器 ， 其 目的 是 简化 程序 设 
计 的 过 程 。 因 为 抽象 允许 程序 人 员 将 注意 力 集中 于 基本 属性 而 忽略 次 要 的 属性 ， 因 而 它 是 一 种 
ALT Tae o 

当代 程序 设计 语言 中 的 两 类 基本 抽象 是 过 程 抽象 和 数据 抽象 。 

过 程 抽象 的 概念 是 程序 设计 语言 设计 中 最 老 的 概念 之 一 。 甚 至 Plankalkiil 也 曾经 支持 过 程 抽 
家 。 所 有 的 子 程序 都 是 过 程 抽象 ， 因 为 它们 提供 了 一 种 方式 ， 来 让 一 个 程序 说 明 所 要 完成 的 某 
些 过 程 ， 而 不 是 提供 如 何 完成 的 细节 (至 少 是 在 调用 程序 之 中 )。 例 如 ， 当 一 个 程序 需要 将 某 种 
类 型 的 数值 数据 对 象 数组 进行 排序 时 ， 它 通常 是 使 用 一 个 子 程序 来 进行 这 种 排序 过 程 。 在 程序 
里 需要 排序 的 位 置 上 ， 通常 使 用 如 下 语句 


sortIint(list, listLen) 


这 个 调用 是 实际 排序 过 程 的 一 种 抽象 ， 而 且 排序 的 算法 并 不 在 这 里 说 明 。 这 种 调用 独立 于 
被 调用 子 程序 中 的 算法 实现 。 

在 子 程序 sortInt 的 情形 中 ， 唯 一 重要 的 一 些 属性 是 : 将 要 被 排序 的 数组 名 称 ， 数 组 元 素 
的 类 型 ， 数 组 的 维 长 ， 以 及 对 于 sortInt 的 调用 将 产生 数组 排序 的 事实 。 在 sortInt 中 所 实现 
的 特殊 算法 是 一 种 对 于 用 户 并 不 重要 的 属性 。 用 户 只 需要 知道 排序 子 程序 的 名 称 以 及 协议 ， 以 
便 能 够 使 用 这 个 子 程序 。 
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数据 抽象 必 将 随 着 过 程 抽象 的 发 展 而 发 展 ， 因 为 每 一 种 数据 抽象 中 的 一 个 不 可 分 割 的 中 心 
部 分 ， 都 是 被 定义 为 过 程 抽象 的 操作 。 


11.2 数据 抽象 介绍 


从 语法 的 角度 而 言 ， 抽 象 数 据 类 型 是 一 个 封装 ， 它 仅仅 包括 一 种 特定 数据 类 型 的 数据 表示 ， 
以 及 一 些 给 这 种 类 型 提供 操作 的 子 程序 。 通 过 访问 控制 ， 可 以 将 类 型 的 一 些 不 必要 的 细 廊 对 这 
个 封装 以 外 的 、 使 用 这 种 类 型 的 单位 隐藏 起 来 。 使 用 抽象 数据 类 型 的 程序 单位 可 以 声明 这 种 类 
型 的 变量 ， 即 使 这 种 类 型 的 实际 表示 对 于 它们 是 隐藏 的 。 抽 象 数 据 类 型 的 实例 称 为 对 象 。 

数据 抽象 的 动机 之 一 与 过 程 抽象 的 动机 相 类 似 。 它 是 用 来 对 抗 复杂 性 的 一 种 武器 ， 是 使 管 
理 大 型 以 及 复杂 程序 比较 容易 的 一 种 方法 。 数 据 抽象 的 其 他 动机 和 数据 抽象 的 优越 性 ， 将 在 本 
节 下 半 部 进行 讨论 。 

将 在 第 12 章 中 描述 的 面向 对 象 程序 设计 是 在 软件 发 展 中 使 用 数据 抽象 所 产生 的 结 末 ， 而 且 
数据 抽象 也 是 面向 对 象 程序 设计 中 最 重要 的 组 成 部 分 之 一 。 


11.2.1 浮 点 数 作 为 抽象 数据 类 型 


至 少 就 内 建 的 类 型 而 言 ， 抽 象 数据 类 型 的 概念 并 不 是 近期 才 发 展 起 来 的 。 所 有 的 内 建 数据 
类 型 ， 甚 至 是 在 Fortran I 中 的 那些 内 建 类 型 ， 都 是 抽象 数据 类 型 ， 虽 然 人 们 很 少 这 样 来 称呼 它 
们 。 例 如 ， 考 虑 一 个 浮 点 数据 类 型 。 大 多 数 语 言 至 少 包括 一 种 这 样 的 类 型 ， 以 提供 创建 浮 点 数 
数据 变量 的 方法 ， 而 且 这 些 语言 还 提供 一 组 算术 操作 来 操纵 这 种 类 型 的 对 象 。 

在 高 级 语言 中 的 浮 点 类 型 采用 了 数据 抽象 中 的 一 个 关键 概念 : 信息 隐藏 。 浮 点 存储 单位 中 
数据 值 的 实际 格式 对 于 用 户 是 隐藏 的 。 唯 一 可 以 使 用 的 一 些 操作 是 由 语言 所 提供 的 操作 。 除 了 
那些 可 以 用 内 建 操作 来 构造 的 操作 之 外 ， 不 允许 用 户 在 这 种 类 型 的 数据 上 创建 新 的 操作 。 用 户 
不 能 直接 操纵 浮 点 对 象 的 实际 表示 部 分 ， 因 为 这 种 表示 是 隐藏 的 。 这 是 允许 程序 在 某 种 特定 话 
言 的 各 种 实现 之 间 进 行 移植 的 特性 ， 即 使 这 些 实现 可 能 使 用 的 是 序 点 值 的 不 同 表 示 。 例 如 ， 在 
IEEE 754 标 准 浮 点 表示 方法 于 20 世 纪 80 年 代 出 现 之 前 ， 不 同 的 计算 机 体系 结构 使 用 几 种 不 同 的 
浮 点 表示 方法 。 然 而 ， 这 些 变 体 并 没有 妨碍 使 用 浮 点 类 型 的 程序 在 各 种 不 同 的 体系 结构 中 移植 。 


11.2.2 用 户 定义 的 抽象 数据 类 型 


一 种 用 户 定义 的 抽象 数据 类 型 应 该 提供 与 语言 所 定义 的 类 型 相同 的 特征 ， 例 如 浮 点 类 型 就 
具有 : (1) 一 种 类 型 定义 :允许 程序 单位 来 声明 这 种 类 型 的 变量 ， 但 隐藏 这 种 类 型 对 象 的 表示 : 
(2) 一 组 操作 : 用 于 操纵 这 种 类 型 的 对 象 。 

我 们 现在 来 形式 地 定义 处 于 用 户 定义 类 型 环境 中 的 抽象 数据 类 型 。 一 种 抽象 数据 类 型 是 满 
足下 面 两 个 条 件 的 数据 类 型 : 

“将 提供 类 型 接口 的 这 种 类 型 的 声明 和 在 这 种 类 型 对 象 上 的 操作 协议 包括 在 一 个 语法 单位 

之 中 。 类 型 的 接口 并 不 依赖 于 这 个 对 象 的 表示 或 这 些 操作 的 实现 。 可 以 将 这 个 类 型 及 其 

操作 实现 于 声明 所 在 的 同一 个 语法 单位 里 ， 也 可 以 实现 在 另外 给 出 的 一 个 语法 单位 中 。 

另外 ， 还 允许 其 他 的 程序 单位 创建 所 定义 类 型 的 变量 。 À 

。 这 种 类 型 对 象 的 表示 ， 对 使 用 这 种 类 型 的 程序 单位 是 隐藏 的 ， 这 样 ， 在 这 些 对 象 上 所 可 

能 的 直接 操作 就 是 类 型 定义 中 所 提供 的 那些 操作 。 

SHEARER ee EEEE, 是 提供 了 将 程序 组 织 成 为 

一 些 可 以 分 别 编译 的 逻辑 单位 方法 。 将 类 型 及 其 操作 实现 在 另外 一 个 语法 单位 中 的 优点 ， 是 这 
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种 做 法 能 够 将 说 明 与 实现 保持 分 离 。 使 用 某 一 种 特殊 抽象 数据 类 型 的 一 些 程序 单位 ， 被 称 为 这 
种 类 型 的 客户 (client)， 这 些 程序 单位 需要 类 型 的 说 明 可 见 ， 但 却 不 被 允许 看 见 这 种 类 型 的 实 
现 。 如 有 打 将 声明 和 类 型 及 其 操作 定义 都 放置 于 同一 个 语法 单位 之 中 ， 就 必须 有 某 种 特殊 的 方式 
将 指定 定义 单元 的 部 分 对 于 客户 隐藏 起 来 。 

类 型 的 接口 独立 于 对 象 的 表示 或 独立 于 操作 实现 的 好 处 是 ， 它 允许 可 以 随时 改变 这 些 表示 ， 
而 不 需要 对 类 型 的 客户 进行 修改 。 

信息 隐藏 的 好 处 是 提高 可 靠 程 度 。 客 户 不 能 够 有 意 或 无 意 地 直接 操纵 对 象 的 内 部 表示 ， 这 
样 就 增强 了 对 象 的 整体 性 。 只 有 通过 所 提供 的 操作 才能 够 改变 对 象 。 


11.2.3 示例 
试想 构造 一 个 栈 的 抽象 数据 类 型 ， 它 具有 以 下 这 些 抽 象 操作 : 
create(stack) 创建 并 可 能 初始 化 一 个 栈 对 象 
destroy(stack) 解除 分 配 栈 的 存储 空间 
empty(stack) 一 个 谓词 (或 布尔 ) 函数 ， 如 果 所 说 明 的 栈 是 空 的 ， 它 的 返 
回 值 为 真 ， 否 则 ， 它 的 返回 值 为 假 
push(stack, element) 将 被 说 明 的 元 素 推 人 所 说 明 的 栈 中 
pop(stack) 将 顶端 的 元 素 移 出 所 说 明 的 栈 
top(stack) 从 所 说 明 的 栈 中 返回 顶端 元 素 的 副本 


注意 ， 一 些 抽象 数据 类 型 的 实现 并 不 要 求 创 建 与 解除 这 两 种 操作 。 例 如 ， 定 义 一 个 变量 为 
一 种 抽象 数据 类 型 ， 可 能 就 隐 式 地 创建 了 这 个 变量 的 数据 结构 ， 并 且 还 隐 式 地 将 它 初始 化 .这 
种 变量 的 存储 空间 可 能 会 在 该 变量 的 作用 域 终结 时 隐 式 地 解除 分 配 。 

这 种 栈 类 型 的 一 个 客户 可 以 具有 下 面 的 代码 序列 ; 


create(stkl); 
push(stkl, colorl); 
push(stkl, color2); 
if(! empty(stk1) ) 
temp = top(stkl); 


假设 栈 抽象 的 初始 实现 使 用 了 一 种 邻接 表示 (一 种 在 数组 中 实现 栈 的 表示 方法 ) 。 但 后 来 ， 
因为 邻接 表示 所 存在 的 存储 器 的 管理 问题 ， 又 将 邻接 表示 改变 为 链表 示 。 因 为 使 用 了 数据 抽象 ， 
这 种 改变 可 以 在 定义 栈 类 型 的 代码 上 进行 ， 而 不 要 求 栈 抽象 的 任何 客户 进行 改变 。 尤 其 是 ， 不 需 
要 改变 上 例 中 的 代码 序列 。 当 然 ， 任 何 一 种 在 操作 协议 上 的 改变 都 将 要 求 在 客户 中 进行 改变 。 


11.3 抽象 数据 类 型 的 设计 问题 


在 一 种 语言 中 定义 抽象 数据 类 型 的 机 制 ， 必 须 提供 一 种 语法 单位 ， 这 个 语法 单位 包含 了 抽 
家 操作 的 类 型 定义 以 及 子 程序 定义 。 必 须 使 类 型 名 称 和 子 程序 的 首部 对 于 这 种 抽象 的 客户 为 可 
匈 的 。 这 样 就 允许 了 客户 来 声明 这 种 抽象 类 型 的 变量 ， 并 且 可 以 操纵 这 些 变量 的 值 。 虽 然 类 型 
名 称 必须 具有 外 部 可 见 性 ， 但 却 必须 将 类 型 定义 隐藏 起 来 。 

除了 那些 类 型 定义 中 所 提供 的 操作 外 ， 应 该 给 抽象 数据 类 型 的 对 象 提供 少数 的 、 通 用 的 内 
建 操作 (如 果 有 的 话 )。 实 际 上 ， 很 少 有 适用 广泛 的 抽象 数据 类 型 的 操作 。 仅 有 的 这 些 操作 包括 
赋值 和 进行 等 于 与 不 等 于 的 比较 。 如 果 这 种 语言 不 允许 用 户 将 赋值 操作 重 载 ， 就 必须 将 赋值 设 
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置 为 内 建 的 。 在 某 些 情 形 下 ， 应 该 预定 义 等 于 与 不 等 于 比较 的 操作 ， 但 在 其 他 的 情形 下 则 不 然 。 
例如 ， 如 果 将 这 种 类 型 实现 为 指针 ， 等 于 则 可 能 意味 着 指针 的 相等 ， 但 是 用 户 可 能 希望 的 是 ， 
它 应 该 意味 着 指针 所 指 癌 的 结构 相等 。 

某 些 操作 可 能 为 大 多 数 的 抽象 数据 类 型 所 需要 ， 但 是 因为 这 些 操作 不 是 通用 的 ， 所 以 必须 
由 类 型 的 设计 人 员 来 提供 。 在 这 些 操作 中 包括 : 迭代 器 、 存 取 妖 、 构 造 器 以 及 析 构 器 。 和 迭代 器 
曾经 在 第 8 章 讨论 过 。 存 取 器 提供 了 对 于 隐藏 于 客户 而 不 能 够 直接 存 取 的 数据 的 一 种 存 取 形 式 。 
构造 络 用 于 为 新 创建 对 象 的 某 些 部 分 设 定 初 值 。 析 构 器 则 用 来 回收 被 抽象 数据 类 型 对 象 的 部 分 
所 使 用 过 的 堆 存储 空间 。 

如 前 所 述 ， 一 个 抽象 数据 类 型 的 封装 定义 了 单数 据 类 型 及 其 操作 。 许 多 当代 语言 ， 包 括 
C++、Java 以 及 C#， 都 直接 支持 抽象 数据 类 型 。 一 种 替代 的 方法 是 提供 一 种 可 以 定义 任何 数目 
的 实体 的 、 更 一 般 化 的 封装 结构 ， 对 于 其 中 的 任何 实体 ， 都 可 以 有 选择 地 说 明 为 在 封装 单位 以 
外 可 见 。 这 就 是 Ada 中 所 使 用 的 方式 。 这 些 封装 不 是 抽象 数据 类 型 ， 而 是 抽象 数据 类 型 的 一 般 
化 。 这 样 ， 就 可 以 使 用 它们 来 定义 抽象 数据 类 型 。 虽 然 我 们 在 这 一 节 中 讨论 了 Ada 的 封装 结构 ， 
但 我 们 将 它 处 理 成 一 种 用 于 单数 据 类 型 的 小 型 封装 。 关 于 通用 的 封装 是 11.6 节 的 讨论 课题 。 

抽象 数据 类 型 的 首要 设计 问题 是 ， 是 否 可 以 将 它们 参数 化 。 例 如 ， 如 果 这 种 语言 支持 有 参 
数 的 抽象 数据 类 型 ， 人 们 就 可 以 设计 一 种 可 以 存储 任何 标量 类 型 元 素 的 队 的 抽象 数据 类 型 。 

天 于 有 参数 的 抽象 数据 类 型 ， 将 在 11.5 节 中 讨论 。 另 外 的 一 个 设计 问题 是 ， 提 供 什 么 样 的 
存 取 控制 和 怎样 来 说 明 这 种 控制 。 
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C++ 语言 : 诞生 、 广 泛 被 人 们 接受 和 遭受 到 的 批评 

BJARNE STROUSTRUP 
| Bjarne Stroustrup 征 C++ 的 设计 者 和 最 早 的 实现 者 ， 也 是 《C++ 程序 设计 语言 》 
G 和 《C++ 的 设计 与 发 展 》 的 作者 。 他 的 研究 兴趣 包括 分 布 式 系统 模拟 、 设 计 、 程 序 设 

< 计 以 及 程序 设计 语言 。Stroustrup 博 士 是 美国 得 克 萨 斯 州 A&M 大 学 工学 院 的 计算 机 科 
学 教授 。 他 积极 参与 了 ANSIISO 的 C++ 标准 化 。 在 A&M 大 学 工作 了 二 十 多 年 之 后 ， 
他 仍然 保持 着 与 AT&T 实 验 室 的 联系 ， 作 为 信息 与 软件 系统 研究 实验 室 的 成 员 来 从 事 科 学 研究 。 他 是 ACM 
的 高 级 成 员 ，AT&T 贝 尔 实验 室 的 高 级 成 员 ，AT&T 的 高 级 成 员 。 在 1993 年 ，Stroustrup 荣 获 了 ACM 的 
Grace Murray Hopper 奖 ， 问 奖 他 早年 对 C++ 程序 设计 语言 的 黄 基 工作 。Stroustrup 博 士 在 先前 基础 上 的 继续 
劳力， 使 得 C++ 成 为 计算 机 历史 上 最 有 影响 力 的 程序 设计 语言 。 

I. 你 与 计算 机 的 简略 历史 | 

A): 你 在 20 世 纪 80 年 代 初 加 入 贝尔 实验 室 之 前 ， 曾 在 做 些 什么 ， 在 什么 地 方 ? 

E: 在 贝尔 实验 室 ， 我 在 分 布 式 系统 的 一 般 领 域 从 事 研究 工作 。 我 是 1979 年 加 入 贝尔 的 。 在 那 之 前 ， 
我 在 剑桥 大 学 完成 博士 学 位 。 

问 : 你 马上 就 开始 了 在 “ 带 类 的 C” 方 面 的 工作 (“ 带 类 的 C” 后 来 成 了 C++) 吗 ? 

E: 在 开始 “ 带 类 的 C” 之 前 ， 在 开发 “ 带 类 的 C” 和 C++ 的 过 程 中 ， 我 在 与 分 布 式 系统 有 关 的 几 个 
项 目 中 工作 。 例 如 ， 我 试图 找到 一 种 方法 将 UNIX 内 核 分 布 到 几 台 计算 机 上 。 还 有 就 是 帮助 很 多 项 目 建 立 
模拟 器 。 

问 : 是 不 是 由 于 对 数学 的 兴趣 使 你 进入 了 这 个 职业 ? 

E: 我 本 科 修 的 专业 是 “数学 与 计算 机 科学 ”， 读 硕士 时 研究 数学 。 那 时 ， 我 错误 地 认为 计算 
(computing) 就 是 某 一 种 应 用 数学 。 我 学 习 了 两 年 数学 后 却 发 现 自己 是 一 个 很 糟糕 的 数学 家 ， 但 还 是 从 中 
学 到 了 很 多 东西 。 在 我 学 习 时 ， 从 来 就 没有 见 过 计算 机 。 我 所 喜欢 的 是 程序 设计 ， 而 不 是 那些 更 偏向 于 数 
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学 的 领域 。 

1 剖析 一 门 成 功 的 语言 

我 喜欢 从 后 往 前 : 先 列 出 一 些 我 认为 使 得 C++ 成 功 的 因素 ， 再 听 听 你 的 看 法 。 这 种 顺序 就 是 开放 
源 代码 ”"， 非 专利 ， 以 及 ANSI/ISO 的 标准 化 。 

ANSVISO 的 标准 化 很 重要 。 当 时 存在 着 几 种 独立 开发 和 发 展 的 C++ 实 现 。 如 果 没 有 一 种 标准 来 计 它 
们 遵守 ， 如 果 没 有 一 个 标准 的 过 程 来 协调 C++ 的 发 展 ，C++ 方 言 中 将 会 爆发 出 一 场 混 乱 。 

在 有 “开放 源 代码 ”的 实现 同时 又 有 商业 化 的 实现 ， 这 也 很 重要 。 另 外 对 于 很 多 用 户 十 分 关键 的 是 ， 
C++ 的 标准 将 保护 他 们 不 受 语言 实现 者 的 操纵 。 

ISO 标 准 化 过 程 是 公开 和 民主 的 。C++ 的 委员 会 很 少 在 少 于 50 个 人 时 开会 。 典 型 的 是 ， 每 一 次 会 议 ， 
与 会 代表 都 来 自 八 个 以 上 的 国家 。 它 不 仅仅 是 一 个 商家 的 论坛 。 

C++ 契 系统 程序 设计 的 理想 工具 (在 C++ 诞 生 时 ， 系 统 程 序 设计 是 开发 代码 市 场 中 最 大 的 一 个 部 分 )、 

且 确 ，C++ 是 任何 系统 程序 设计 项 目的 有 力 竞争 者 。 它 也 是 嵌入 式 系统 程序 设计 的 有 效 工具 。 企 入 式 
系统 是 当前 发 展 最 快 的 一 个 领域 。 C++ 的 为 一 个 领域 是 高 性 能 的 数值 /工程 /科学 的 程序 设计 、。 

c++ 的 面向 对 象 的 特征 和 它 对 于 类 或 库 的 引入 ， 使 得 程序 设计 具有 更 高 的 效率 和 透明 性 

C++ 年 一 种 多 风格 的 程序 设计 语言 。 即 它 支持 多 种 基本 的 程序 设计 风格 (包括 面向 对 象 程序 设计 ) 以 
及 这 毕 风 格 的 结合 。 当 使 用 得 当时 ， 将 导致 比 使 用 任何 单独 的 程序 设计 风格 更 为 简洁 、 灵 活 和 高 效率 的 程 
序 库 。 一 个 例子 就 是 关于 C++ 的 标准 程序 库 和 算法 ， 这 基本 上 是 一 个 通用 的 程序 设计 框架 。 当 这 种 框架 与 
( 面 内 对 象 的 ) 类 层次 结构 一 起 使 用 时 ， 结 果 就 导致 了 类 型 安全 性 、 高 效率 和 灵活 性 的 卓越 结 人 

C++ 在 AT&T 的 开发 环境 中 的 钥 化 ，。 


凡 同 一 批 杰 出 的 研究 人 员 。 自 始 至 终 ，AT&T 都 支持 C++ 的 标准 化 。 然 而 ， 与 很 多 当代 语言 不 同 的 是 
C++ 不 征 排山倒海 的 市 场 攻 势 的 受 惠 者 。 因 为 这 些 本 来 就 不 是 实验 室 的 工作 方式 ， 

我 有 没有 什么 最 重要 的 遗漏 ?肯定 会 有 。 

现在 ， 让 我 再 来 谈 谈 对 于 C++ 的 批评 ， 以 及 还 想 听 听 你 的 看 法 ， C++ 庞大 且 笨 重 ， 它 的 “hello world” 
程序 比 C 中 的 大 十 倍 。 

C++ 月 定 不 是 一 种 小 型 语言 。 但 没有 什么 当代 语言 是 小 型 语言 。 如 果 一 种 语言 很 小 的 话 ， 你 就 会 需要 
有 巨 玉 的 程序 库 才 行 。 通 常 ， 你 得 依赖 于 协定 和 扩展 。 对 于 那些 有 着 不 可 避免 的 复杂 性 的 关键 部 分 ， 我 宁 
可 把 它们 包括 在 语言 之 中 而 不 是 藏 在 系统 中 的 别 的 什么 地 方 。 在 语言 中 ， 它 们 是 可 见 的 ， 能 够 被 学 习 并 是 
能 哆 伞 有 效 地 标准 化 。 对 于 大 多 数 的 目的 ， 我 并 不 认为 C++ 是 笨重 的 。 在 我 的 机 器 上 ，C++ 的 “hello 
world” 程序 并 不 比 C 中 的 更 大 ， 在 你 的 机 器 上 ,也 不 应 该 更 大 。 事实 上 ， 在 我 的 机 器 上 的 “hello world” 
C++ 程序 的 目标 代码 比 C 中 的 还 小 。 为 什么 一 种 语言 的 程序 会 比 另 一 种 语言 的 小 ， 这 并 不 是 语言 本 身 的 盾 
四 ， 这 完全 是 实现 者 如 何 组 织 程序 库 的 问题 。 如 果 一 种 语言 的 程序 会 比 另外 一 种 语言 大 很 多 ， 就 应 该 向 这 
种 语言 的 实现 人 员 报 告 这 个 问题 。 

批评 者 说 ， 较 之 C， 使 用 C++ 编写 程序 比较 困难 。 甚 至 你 也 承认 过 这 一 点 ， 说 如 果 用 C 来 对 比 C++ 的 
话 ， 是 “ 自 找 麻 烦 一 一 自己 射 自己 的 脚 ”。 

蕊 的 ， 我 的 确 说 过 :“ 用 C 你 容易 射 到 自己 的 脚 。 然 而 使 用 C++ 的 话 就 没 那 么 容易 了 ， 但 是 如 果 你 真 的 
射 到 了 ， 你 会 将 整 条 腿 都 炸 飞 的 "。 这 里 我 说 的 是 关于 C++， 但 却 在 不 同 程度 上 适用 于 所 有 功能 强大 的 语 
豆 。 当 你 保护 人 们 使 之 不 至 遇 到 简单 的 危险 时 ， 他 们 却 会 磁 到 新 的 和 不 那么 明显 的 问题 。 一 个 避免 了 简单 
门 题 的 人 ， 很 可 能 就 会 遇 到 不 那么 简单 的 问题 。 一 个 具有 保护 能 力 的 环境 的 缺点 ， 可 能 是 发 现 困 难 时 大 晚 
的 同 题 ， 而 且 一 县 发 现 了 问题 ， 却 很 难 进行 修复 。 况 且 ， 罕 见 的 问题 比 常见 的 问题 更 难以 发 现 ， 原 因 是 你 
不 容易 怀疑 它 。 

++ 对 今天 的 嵌入 式 系统 是 合适 的 ， 但 对 今天 的 互联 网 软件 却 是 不 合适 的 。C++ 适 合 于 今天 的 嵌入 式 
系统 。 
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C++ 也 适合 于 并 被 广泛 地 应 用 于 今天 的 “互联 网 软件 ”。 例 如 ， 看 看 我 的 C++Application 网 页 。 你 会 注 
意 到 一 些 万 维 网 服务 的 主要 提供 者 ， 例 如 Amazon、Adobe、Google、Quicken 和 Microsoft， 都 在 关键 之 处 
依赖 于 C++。 计 算 机 游戏 也 是 大 量 应 用 C++ 的 领域 。 

我 有 没有 遗漏 什么 其 他 的 重要 的 批评 ? 当然 也 会 有 。 





11.4 语言 示例 


抽象 数据 类 型 概念 的 原始 形态 是 在 SIMULA 67 语 言 之 中 ， 虽 然 这 种 语言 仅仅 部 分 地 支持 抽 
家 数据 类 型 。 在 这 一 节 中 我 们 将 描述 Ada、C++、Java、C# 和 Ruby 语 言 中 对 于 数据 抽象 的 支持 。 


11.4.1 Ada 中 的 抽象 数据 类 型 


Ada 提 供 一 种 能 够 用 来 定义 单 抽象 数据 类 型 的 封装 结构 ， 包 括 隐藏 其 表示 的 功能 。Ada 是 第 
一 种 提供 对 于 抽象 数据 类 型 全 面 支持 的 语言 。 

11.4.1.1 ,封装 

Ada 中 的 封装 结构 ， 被 称 为 包 (package)。 包 可 以 有 两 个 部 分 ， 其 中 的 每 一 个 部 分 也 被 称 
AL: 其 一 为 说 明 包 (specification package)， 它 提供 封装 的 接口 ， 另外 一 个 为 体 包 (body 
package) ， 提 供 在 说 明 中 所 命名 的 大 多 数 实体 的 实现 ， 如 果 不 是 关联 的 说 明 包 中 全 部 的 实体 实 
现 的 话 。 并 不 是 所 有 的 包 都 具有 体 包 部 分 (仅仅 包含 类 型 与 常量 的 包 ， 不 具有 或 者 是 不 需要 有 
kE). 

一 个 说 明 包 和 与 其 相关 联 的 体 包 ， 共 享 同 一 个 名 字 。 在 一 个 包 的 首部 中 ， 保 留 字 body 将 这 
个 包 标识 为 一 个 体 包 。 说 明 包 与 体 包 ， 可 以 被 分 开 编译 ， 但 必须 首先 编译 说 明 包 ， 

11.4.1.2 信息 隐藏 

定义 一 种 数据 类 型 的 Ada 包 的 设计 人 员 ， 可 以 选择 是 使 得 这 种 类 型 对 于 客户 完全 可 见 ， 还 
是 仅仅 提供 接口 信息 。 当 然 ， 如 果 没 有 将 类 型 的 表示 隐藏 的 话 ， 那 么 这 种 定义 的 类 型 就 不 是 一 
种 抽象 数据 类 型 。 有 两 种 方式 将 说 明 包 中 的 类 型 表示 对 于 客户 隐藏 起 来 。 一 种 方式 是 通过 提供 
说 明 包 的 两 个 段 来 施行 : 一 个 段 中 的 实体 对 于 客户 是 完全 可 见 的， 而 另外 一 个 段 中 的 内 容 则 对 
客户 隐藏 起 来 。 对 于 一 种 抽象 数据 类 型 ， 一 种 缩写 的 声明 将 出 现在 说 明 中 的 可 见 部 分 ， 这 个 声 
明 仅 仅 提供 类 型 名 称 和 这 种 类 型 表示 被 隐藏 的 事实 。 类 型 表示 出 现在 说 明 中 的 部 分 被 称 为 私有 
部 分 ， 它 由 保留 字 private 引 入 。private 子 句 总 是 位 于 说 明 的 末尾 。 

将 表示 隐藏 起 来 的 第 二 种 方式 ， 是 将 抽象 数据 类 型 定义 为 指针 ， 并 且 在 体 包 中 提供 指向 结 
构 的 定义 ， 将 所 有 这 些 内 容 都 对 于 客户 隐藏 起 来 。 

下 面 是 前 面 这 种 方式 ， 将 类 型 表示 对 于 客户 隐藏 起 来 的 一 个 例子 。 假 设 将 在 一 个 包 中 定义 
一 个 命名 为 Node_Type 的 抽象 数据 类 型 。Node_Type 将 被 声明 于 说 明 包 中 的 可 见 部 分 ， 但 没 
有 表示 的 细节 ， 如 下 列 语句 : 

type Node Type is private; 

将 被 声明 为 私有 的 类 型 称 为 私有 类 型 。 私 有 数据 类 型 具有 内 建 的 赋值 以 及 等 于 与 不 等 于 的 
比较 操作 。 任 何其 他 操作 ， 都 必须 在 定义 这 种 类 型 的 说 明 包 中 声明 

人 生意， 在 下 面 例子 中 的 private 子 句 中 ， 对 于 Node_Type 的 声明 是 重复 的 ， 但 是 这 一 次 ， 
具有 完整 的 类 型 定义 。 


package Linked List Type is 
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type Node Type is private; 
private 
type Node Type; 
type Ptr is access Node Type; 
type Node Type is 


record 
Info : Integer; 
Link : Ptr; 


end record; 
end Linked List Type; 
注意 在 这 个 包 中 的 private 子 句 里 ， 既 有 Node_Type 的 声明 ， 又 有 Node_Type 的 定义 。 
因为 在 Ptr 的 定义 中 对 于 Node_Type 的 引用 ， 这 个 引用 又 前 置 于 Node_Type 的 定义 ， 因 而 这 
个 声明 是 必要 的 。 因 为 是 被 定义 于 private 子 句 之 中 ， 对 于 Linked_List_Type 的 客户 ， 
Info 和 Link 都 是 不 可 见 的 。 
如 果 在 一 个 包 中 没有 实体 需要 隐藏 ， 就 没有 必要 包括 说 明 中 的 私有 部 分 。 当 然 ， 这 样 的 一 
种 包 就 不 能 够 定义 一 种 抽象 数据 类 型 。 
类 型 表示 之 所 以 会 出 现在 说 明 包 中 ， 其 原因 是 与 编译 问题 紧密 相关 的 。 客 户 只 能 看 见 说 明 
包 【〈 而 不 是 体 包 ) ， 但 编译 绒 必须 能 够 在 编译 客户 时 ， 给 输出 类 型 的 对 象 分 配 存储 空间 。 此 外 ， 
只 有 当 抽 象 数据 类 型 的 说 明 包 存在 并 且 已 经 被 编译 了 时 ， 客 户 才 是 可 编译 的 。 因 此 ， 编 译 器 必 
须 能 够 确定 来 自 说 明 包 的 对 象 的 大 小 。 所 以 类 型 的 表示 对 于 编译 器 必须 为 可 见 的 ， 但 对 于 客户 
代码 则 是 不 可 见 的 。 这 恰恰 是 说 明 包 中 的 private 子 句 所 说 明 的 情形 。 
在 上 述 例子 中 ,说明 包 提 供 部 分 实现 细 市 (关于 数据 的 定义 )， 而 实现 的 其 他 细节 (关于 操 
作 的 定义 ) 却 在 体 包 之 中 ， 这 确实 在 某 种 程度 上 带 来 了 麻烦 。 如 果 说 明 包 仅仅 提供 接口 ， 而 体 包 
则 提供 实现 的 所 有 细 市 ， 将 会 清晰 得 多 。 通 过 将 抽象 数据 类 型 设计 成 指针 的 方式 ， 将 会 消除 这 
种 问题 ， 如 下 面 的 定义 : 
package Linked List Type is 
type Node is private; 
function Create Node() return Node; 
private 
type Node Record; 


type Node is access Node Record; 
end Linked list Type; 


现在 就 可 以 将 所 有 的 实现 细 证 都 在 体 包 中 给 出 ， 如 下 所 示 : 


package body Linked List Type is 
type Node Record is 


record 
Info : Integer; 
Link : Ptr; 


end record; 
end Linked List Type; 


这 种 稍微 清晰 的 版 本 也 存在 着 儿 个 问题 。 第 一 ， 处 理 指针 有 一 些 内 在 的 困难 。 第 二 ， 在 新 
的 抽象 数据 类 型 的 一 些 对 象 之 间 进行 的 比较 ， 将 会 成 为 指针 之 间 的 比较 ， 这 种 比较 不 会 产生 所 
期 望 的 结 采 ， 因 为 比较 的 是 指针 ， 而 不 是 指针 所 指向 的 那些 对 象 。 将 抽象 数据 类 型 定义 为 指针 
的 另外 一 个 问题 是 类 型 不 能 够 控制 这 种 类 型 的 对 象 的 分 配 与 解除 分 配 。 例 如 ， 一 个 客户 可 以 产 
生 一 个 指向 对 象 的 指针 (通过 一 个 变量 的 声明 )， 而 并 没有 产生 一 个 对 象 。 
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私有 类 型 的 一 种 替代 类 型 是 一 种 更 受 限 制 的 形式 : 受 限 私有 类 型 。 同 非 指 针 型 的 私有 类 型 
一 样 ， 受 限 私 有 类 型 在 说 明 包 的 私有 段 中 给 予 描述 。 这 里 唯一 的 语法 差别 是 ， 将 受 限 私有 类 型 
在 说 明 包 中 的 可 见 部 分 声明 为 1imited private。 一 种 被 声明 为 受 限 私有 类 型 的 对 象 ， 不 具 
有 内 建 的 操作 。 当 预定 义 的 赋值 操作 和 比较 操作 没有 意义 或 是 没有 用 时 ， 这 样 的 一 种 类 型 就 很 
有 用 。 例 如 ， 对 于 栈 很 少 使 用 赋值 和 比较 操作 。 但 是 如 果 需 要 赋值 和 相等 性 的 比较 操作 但 又 不 
能 够 使 用 内 建 的 版 本 时 ， 就 必须 由 说 明 包 来 提供 这 些 操作 。 这 是 当 抽象 数据 类 型 为 指针 时 ， 避 
免 比 较 问 题 的 一 种 方式 。 赋 值 操作 必须 是 一 种 正常 的 过 程 形 式 ， 而 等 于 和 不 等 于 操作 符 ， 则 可 
以 通过 重 载 新 类 型 的 那些 操作 符 来 提供 。 

11.4.1.3 示例 

下 面 是 一 个 栈 抽象 数据 类 型 的 说 明 包 : 

package Stack Pack is 

-- 可 见 的 实体 ， 或 者 是 公有 的 接口 

type Stack Type is limited private; 
Max Size : constant := 100; 
function Empty(Stk : in Stack Type) return Boolean; 
procedure Push(Stk : in out Stack_Type; 
Element : in Integer); 
procedure Pop(Stk : in out Stack Type); 
function Top(Stk : in Stack Type) return Integer; 
-- 这 一 部 分 对 客户 隐藏 
private 
type List Type is array (1..Max Size) of Integer; 
type Stack Type is 
record 
List : List Type; 
Topsub : Integer range 0..Max Size := 0; 


end record; 
end Stack _ Pack; 


注意 ， 这 里 没有 包括 创建 或 者 解除 的 操作 ， 因 为 它们 不 是 必需 的 。 
Stack Pack 的 体 包 是 : 


with Ada.Text IO; use Ada .Text IO; 
package body Stack Pack is 
function Empty(Stk: in Stack Type) return Boolean is 
begin 
return Stk.Topsub = 0; 
end Empty; 


procedure Push(Stk : in out Stack_Type; 
Element : in Integer) is 
begin 
if Stk.Topsub >= Max Size then 
Put_Line("ERROR - Stack overflow"); 
else 
Stk.Topsub := Stk.Topsub + 1; 
Stk.List(Topsub) := Element; 
end if; 
end Push; 
procedure Pop(Stk : in out Stack Type) is 
begin 
if Stk.Topsub = 0 
then Put_Line("ERROR - Stack underflow"); 


else Stk.Topsub := Stk.Topsub - 1; 
end if; 
end Pop; 


function Top(Stk : in Stack Type) return Integer is 
begin 
if Stk.Topsub = 0 
then Put Line("ERROR - Stack is empty"); 
else return Stk.List(Stk.Tosub); 
end if; 
end Top; 
end Stack Pack; 


这 个 体 包 的 第 一 行 代码 包括 了 两 条 语句 : 一 条 with 语句 和 一 条 use 语 句 。 这 条 with 子 句 
使 得 定义 在 外 部 包 中 名 字 成 为 可 见 的 ， 在 这 个 例子 中 是 Ada .Text_IO， 它 提供 文本 输入 与 输 
出 的 函数 。 这 条 use 子 句 消 除了 对 于 命名 包 中 的 实体 引用 ， 进 行 显 式 限 定 的 需要 。 对 于 外 部 封 
装 的 存 取 以 及 名 字 限 定 的 问题 ， 将 在 11.6 节 中 进一步 讨论 。 

体 包 中 的 子 程序 定义 的 首部 ， 必 须 与 相关 的 说 明 包 中 子 程序 的 首部 相 匹配 。 这 个 说 明 包 承 
诺 ， 这 些 子 程序 将 会 被 定义 在 相关 的 体 包 之 中 。 

下 面 的 过 程 Use_Stacks 是 包 Stack_Pack 的 一 个 客户 。 我 们 用 它 来 说 明 怎 样 使 用 这 
种 包 。 


with Stack Pack ; 
use Stack_Pack; 
procedure Use Stacks is 
Topone : Integer; 
Stack : Stack Type; -- 产生 一 个 Stack_Type 的 对 象 
begin 
Push(Stack, 42); 
Push(Stack, 17); 
Topone := Top(Stack) ; 
Pop(Stack) ; 


end Use _ Stacks; 


对 于 大 多 部 当代 语言 来 说 ， 因 为 它们 的 标准 类 库 包 含 了 对 栈 的 支持 ， 所 以 使 用 栈 是 不 明智 
的 。 但 是 ， 栈 提供 了 一 个 简单 的 例子 ， 以 允许 比较 本 市 讨论 的 语言 。 


11.4.2 C++ 中 的 抽象 数据 类 型 


C++ 是 通过 将 一 些 特 性 加 入 C 语 言 中 而 创建 的 。 所 增加 的 第 一 种 重要 特性 ， 是 支持 面向 对 象 
程序 设计 。 因 为 面 癌 对 象 程序 设计 的 主要 成 分 之 一 是 抽象 数据 类 型 ， 所 以 显然 ，C++ 就 必须 支 
持 它 们 。 

Ada 提 供 能 够 用 来 模拟 抽象 数据 类 型 的 包 ，C++ 提 供 两 种 相互 类 似 的 结构 : 类 (class) 和 结 
构 (struct), ， 可 更 为 直接 地 支持 抽象 数据 类 型 。 当 仅仅 涉及 数据 时 ，C++ 中 的 结构 被 最 为 普遍 地 
使 用 ， 我 们 将 不 在 这 里 做 进一步 的 讨论 。 

C++ 中 的 类 是 类 型 ， 而 如 前 所 述 的 Ada 中 的 包 则 是 更 为 一 般 化 的 封装 ， 它 可 以 定义 任意 数目 
的 抽象 数据 类 型 。 当 一 个 程序 单位 获得 了 对 于 一 个 Ada 包 的 可 见 性 时 ， 便 可 以 直接 通过 名 字 来 
访问 这 个 包 中 的 任何 公有 (public) 实体 。 而 当 一 个 C++ 的 程序 单位 声明 了 某 个 类 的 一 个 实例 
时 ， 也 可 以 访问 这 个 类 中 的 任何 公有 实体 ， 但 仅仅 能 够 通过 这 个 类 中 的 实例 来 进行 。 这 是 一 种 
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提供 抽象 数据 类 型 的 更 为 清晰 与 直接 的 方式 。 

11.4.2.1 封装 

在 C++ 的 类 中 所 定义 的 数据 ， 被 称 为 数据 成 员 (data member) ;而 在 一 个 类 中 所 定义 的 函数 
就 被 称 为 成 员 函 数 (member function)。 数 据 成 员 和 成 员 函 数 出 现在 两 种 类 属 、 类 和 实例 中 。 类 
成 员 与 类 相关 联 ， 实 例 成 员 与 类 的 实例 相关 联 。 本 章 只 讨论 类 的 实例 成 员 。 一 个 类 中 的 所 有 实 
例 ， 共 享 一 套 成 员 函 数 ， 但 每 一 个 实例 都 有 它 自 己 的 一 套 类 的 数据 成 员 。 类 的 实例 可 以 是 栈 动 
态 的 ， 或 者 是 堆 动 态 的 。 如 果 是 栈 动态 的 ， 可 以 通过 值 变 量 来 引用 。 如 果 是 堆 动态 的 话 ， 则 通 
过 指针 来 引用 。 栈 动态 的 类 的 实例 ， 总 是 通过 对 象 声 明 的 确立 而 创建 的 。 此 外 ， 当 到 达 了 所 声 
明 的 作用 域 未 尾 时 ， 这 种 类 实例 的 生存 期 便 也 终结 。 堆 动态 类 对 象 可 以 通过 new 操 作 符 创建 ， 
通过 daelete 操 作 符 销毁 。 栈 动态 和 堆 动 态 类 都 能 有 引用 堆 动 态 数据 的 指针 数据 成 员 ， 因 此 尽 
管 类 实例 是 栈 动态 的 。 但 是 它 能 包括 引用 堆 动 态 数据 的 数据 成 员 。 

一 个 类 的 成 员 图 数 ， 可 以 通过 两 种 不 同 的 方式 来 定义 ; 完整 的 定义 可 以 出 现在 类 中 或 仅仅 
出 现在 它 的 首部 。 当 一 个 成 员 函 数 的 首部 和 函数 体 都 出 现在 类 的 定义 中 时 ， 这 个 成 员 函 数 就 是 
隐 式 内 联 的 。 这 意味 着 它 的 代码 被 放置 在 调用 程序 之 中 ， 而 不 需要 一 般 的 调用 与 返回 的 连接 过 
程 。 如 果 只 有 成 员 函 数 的 首部 出 现在 类 的 定义 中 ， 它 的 完整 定义 就 将 出 现在 类 的 外 部 ， 并 上 且 是 
被 分 别 编译 的 。 允 许 合理 内 联 成 员 函 数 将 为 实时 应 用 程序 节省 链接 时 间 ， 运 行 时 效率 是 最 重要 
的 。 内 联 成 员 函 数 的 缺点 是 聚 徐 了 类 定义 界面 ， 从 而 减少 了 可 读 性 。 

11.4.2.2 信息 隐藏 

C++ 中 的 类 可 以 包含 隐藏 的 和 可 见 的 两 种 实体 ( 指 它们 对 类 的 客户 是 可 见 还 是 隐藏 的 ) 。 将 
隐藏 的 实体 放置 在 Private 子 句 中 ， 而 将 可 见 的 实体 或 者 是 公有 实体 写 进 一 个 public 子 句 里 。 
因而 public 子 句 描述 的 是 与 类 中 对 象 的 接口 。 还 有 第 三 种 类 型 的 可 见 性 ， 即 被 保护 的 
(Protected)。 关 于 这 种 可 见 性 ， 将 在 第 12 章 中 讨论 继承 时 再 进行 讨论 。 

C++ 人 允许 用 户 在 类 的 定义 中 包括 构造 器 函数 ， 这 种 函数 被 用 来 给 新 创建 对 象 中 的 数据 成 员 
设 定 初 值 。 构 造 器 也 可 以 给 新 对 象 的 指针 引用 的 堆 动 态 数 据 成 员 分 配 空间 。 当 创建 一 个 类 的 对 
象 时 ， 构 造 器 被 隐 式 地 调用 。 一 个 构造 器 的 名 字 与 它 施行 初始 化 的 对 象 所 属 的 类 的 名 字 相 同 。 
构造 器 可 以 被 重 载 ， 然 而 ， 一 个 类 中 的 每 一 个 构造 器 都 必须 具有 了 唯一 的 参数 描绘 。 

C++ 中 的 类 还 可 以 包括 一 个 被 称 为 析 构 器 的 函数 ， 当 这 个 类 的 实例 生存 期 终止 时 ， 则 隐 式 
地 调用 析 构 器 。 如 前 所 述 ， 栈 动态 类 的 实例 可 以 包含 堆 动态 的 数据 成 员 。 这 种 实例 的 析 构 器 函 
数 ， 包 括 了 一 个 用 于 堆 动 态 成 员 的 delete 操 作 符 ， 来 对 于 这 些 成 员 施行 堆 空间 的 解除 分 配 。 
析 构 器 也 常常 被 用 作 程 序 调 试 的 一 种 辅助 工具 ， 在 这 种 情况 下 ， 在 对 象 的 数据 成 员 被 解除 分 配 
之 前 ， 析 构 器 仅仅 是 显示 或 打印 这 个 对 象 的 一 些 数据 成 员 或 全 部 数据 成 员 的 值 。 一 个 析 构 器 的 
名 字 也 是 类 的 名 字 ， 只 在 前 面 放置 “~” 号 。 

构造 器 和 析 构 器 都 没有 返回 类 型 ， 也 都 不 使 用 retuzrn 语 句 。 它 们 都 可 以 被 显 式 地 调用 。 

11.4.2.3 示例 

青 一 次 ， 我 们 的 C++ 中 抽象 数据 类 型 的 例子 也 是 一 个 栈 : 


#include <iostream.h> 
class stack { 
private: //** 这 些 成 员 ， 仅仅 对 于 其 他 的 成 员 以 及 友 元 类 为 可 见 的 (参见 11.6.4 节 ) 
int *stackPtr; 
int maxLen; 
int topPtr; 
public: //** 这 些 成 员 对 于 客户 为 可 见 的 
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stack() { //** 一 个 构造 器 
stackPtr = new int [100]; 
maxLen = 99; 
topPtr = -1; 

} = 

~stack() {delete [] stackPtr;}; //** 一 个 析 构 器 

void push(int number) { 
if (topPtr == maxLen) 

cerr << "Error in push——stack is full\n"; 
else stackPtr[++topPtr] = number; 


} 
void pop() { 
if (topPtr == -1) 
cerr << "Error in pop——stack is empty\n"; 
else topPtr--; 


} 
int top() {return (stackPtr[topPtr]);} 


int empty() {return (topPtr == -1);} 

} 

我 们 将 只 讨论 这 个 类 定义 的 少数 几 个 方面 ， 因 为 并 不 需要 了 解 这 段 代码 的 所 有 细节 。 类 
stack 具 有 三 个 数据 成 员 stackPtr, maxLen 以 及 topPtr。 所 有 这 三 个 成 员 都 是 私有 的 。 
它 还 具有 四 个 公有 的 成 员 函 数 : push，pop，top 和 empty。 还 有 一 个 构造 器 和 一 个 析 构 器 。 
这 个 构造 器 使 用 分 配 操作 符 new， 来 从 堆 上 分 配 一 个 具有 100 个 int 类 型 元 素 的 数组 。 它 还 设 定 
maxLen 和 topPtr 的 初 值 。 这 个 析 构 器 函数 的 目的 ， 是 当 stack 对 象 的 生存 期 终止 时 ， 对 用 于 
实现 这 个 栈 的 数组 的 存储 空间 ， 进 行 解除 分 配 。 这 个 数组 是 由 构造 器 来 实施 分 配 。 因 为 这 个 类 
的 定义 包括 了 成 员 函 数 体 ， 它 们 都 是 隐 式 内 联 的 。 

一 个 使 用 stack 抽 象 数 据 类 型 的 示例 程序 如 下 : 


void main() { 
int topOne; 
stack stk; //** 产生 stack 类 的 一 个 实例 
stk.push(42); 
stk.push(17); 
topOne = stk.top(); 
Stk.pop(); 


} 


11.4.2.4 评估 

C++ 通过 它 的 类 结构 来 支持 抽象 数据 类 型 , 这 种 表达 能 力 与 Ada 中 通过 包 的 表达 能 力 相 类 似 。 
这 两 种 语言 都 提供 了 封装 和 抽象 数据 类 型 信息 隐藏 的 有 效 机 制 。 它 们 之 间 的 主要 差别 在 于 类 是 
类 型 ， 而 Ada 中 的 包 是 更 一 般 化 的 封装 。 此 外 ， 如 将 在 第 12 章 里 所 要 讨论 的 ， 类 的 设计 超出 了 
数据 抽象 的 功能 。 


11.4.3 Java 中 的 抽象 数据 类 型 


Java 对 于 抽象 数据 类 型 的 支持 与 C++ 中 的 十 分 类 似 。 然 而 又 有 一 些 重要 的 不 同 。 在 Java 中 所 
有 用 户 定 勾 的 数据 类 型 ， 都 是 类 (Java 中 不 具有 结构 ) ， 而 且 所 有 的 对 象 都 是 从 堆 上 分 配 ， 并 通 
过 引用 变量 来 存 取 。Java 与 C++ 在 对 抽象 数据 类 型 的 支持 上 。 另 外 一 个 不 同 之 处 是 ,Java 的 方法 
必须 在 类 中 完整 定义 。 方 法 体 必须 与 相应 的 方法 头 一 起 出 现 。 因 而 ，Java 中 的 一 个 抽象 数据 类 
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型 总 是 同时 被 声明 于 也 被 定义 于 同一 个 语法 单位 之 中 。 通 过 规定 抽象 数据 类 型 的 定义 为 私有 的 ， 
而 将 这 些 定义 对 于 客户 隐藏 起 来 。 
HELSE. 


import java.io.*; 


Java 的 类 定义 中 没有 私有 及 公有 子 句 。 在 Java 中 ， 可 以 将 存 取 修 饰 符 附加 到 方法 以 及 变量 
下 面 是 用 于 我 们 的 栈 示例 的 Java 类 定义 : 


class StackClass { 


private int [] stackRef; 
private int maxLen, 


topindex; 
public StackClass() { 
stackRef = 
maxLen 


// 一 个 构造 器 


new int [100]; 
99; 
topIndex = -1; 
} 


} 


public void push(int number) { 
if (topIndex == maxLen) 


System.out.println("Error in push—stack is full"); 
else stackRef[++topIndex ] 


number; 
public void pop() { 
if (topIndex == 


1) 
} 


else --topIndex; 


} 


System.out.println("Error in pop—stack is empty"); 
public int top() {return (stackRef[topIndex] ) ;} 
public boolean empty() {return (topIndex LYS} 


下 面 是 一 个 使 用 Stackclass 类 的 例子 : 


public class TstStack { 


public static void main(String[] args) 1 
StackClass myStack 


new StackClass(); 

myStack.push(42); 
myStack.push(29); 
System.out.println("29 is: 
myStack.pop(); 
System.out.println("42 is: 
myStack.pop(); 

myStack.pop(); 
} 


} 


” + myStack.top()); 
// 产生 一 个 出 错 信息 


而 ， 正 如 将 在 11.6 节 中 讨论 的 ， 在 C++ 的 多 类 型 封装 与 Java 的 多 类 型 封装 之 间 ， 存 在 着 较 大 的 差 
与 Java 中 的 类 之 间 还 存在 着 更 大 的 差别 。 


一 个 明显 的 区 别 是 ， 在 Java 版 本 中 不 存在 析 构 器 ， 它 由 Java 中 的 隐 式 废料 收集 来 代替 。 
别 。 此 外 ， 当 考虑 到 面向 对 象 程序 设计 的 其 他 方面 时 ， 如 将 在 第 12 章 中 进行 的 ， 在 C++ 中 的 类 
11.4.4 C# 中 的 抽象 数据 类 型 


我 们 的 示例 没有 介绍 很 多 关于 C++ 与 Java 之 间 在 支持 抽象 数据 类 型 方面 的 重要 的 差别 。 然 


C# 语 言 是 基于 C++ 以 及 Java 语 言 的 ， 它 还 包括 了 一 些 新 的 结构 


Hy BM UE A fod Ht YEH ad 


在 C# 中 使 用 存 取 修饰 符 private.、 public 和 protected9 的 方式 ， 与 在 Java 中 使 用 存 取 
修饰 符 的 方式 完全 一 样 。 然 而 ，C# 中 还 包括 了 两 种 额外 的 修饰 符 : internal 和 protected 
internal。 关 于 internal 修 饰 符 ， 将 在 讨论 一 般 化 封装 的 11.6 节 中 给 予 描述 。 

与 Java 中 的 一 样 ，C# 中 的 类 实例 都 是 堆 动态 的 。 给 实例 数据 提供 初始 值 的 默认 构造 器 ， 可 
以 为 所 有 的 类 所 使 用 。 这 些 构造 器 提供 典型 的 初始 值 ， 如 int 类 型 中 的 0、 boolean 类 型 中 的 
false 等 。 用 户 可 以 为 他 或 她 所 设计 的 类 ， 构 造 一 个 构造 器 。 这 样 一 个 构造 器 ， 可 以 给 所 设计 
的 类 中 的 一 些 或 所 有 的 实例 数据 赋 初 始 值 。 任何 在 用 户 定义 的 构造 器 中 没有 被 赋 初 值 的 实例 变 
量 ， 将 由 默认 构造 器 赋 以 初始 值 。 

因为 C# 对 于 它 的 大 多 数 堆 对 象 ， 都 使 用 垃圾 收集 ， 因而 基本 上 不 使 用 析 构 器 。 

虽然 抽象 数据 类 型 的 基本 原则 规定 ， 对 象 的 数据 成 员 应 该 对 客户 隐藏 ， 但 许多 的 实际 情形 
导致 客户 必须 存 取 这 些 数据 成 员 。 通用 的 解决 办 法 是 提供 一 些 存 取 器 方法 : 获取 器 和 设置 器 ， 
这 样 就 允许 间接 地 存 取 所 谓 的 隐藏 数据 。 尽管 客户 可 以 通过 获取 器 和 设置 器 来 存 取 ， 较 之 仅仅 
是 将 数据 定义 为 公有 的 从 而 提供 直接 地 存 取 方式 ， 这 种 间接 方式 更 为 优越 。 说 明 存 取 器 的 方式 
较为 优越 的 理由 ， 主 要 有 如 下 几 点 : 

1. 通过 定义 获取 器 方法 而 不 定义 设置 器 方法 ， 能 够 提供 只 读 的 存 取 。 

2. 在 设置 器 中 可 以 设置 一 些 限制 。 例 如 ， 如 采 需 要 将 数据 值 限制 在 某 一 个 特定 的 范围 中 ， 
设置 器 方法 可 以 强制 实行 。 

3. 如 采 获 取 器 和 设置 器 为 唯一 的 存 取 方 式 ， 束 有 可 能 改变 数据 成 员 的 实际 实现 ， 而 不 会 影 
啊 到 客户 。 

C# 从 Delphi 语 言 继 承 了 属性 ， 作为 不 需要 显 式 的 调用 实现 获取 器 和 设置 器 的 一 种 方式 属 
性 提供 了 对 于 私有 的 实例 数据 的 隐 式 存 取 。 例 如 ， 考虑 以 下 简单 类 和 客户 的 代码 ; 

public class Weather { 

public int DegreeDays { //** DegreeDays 是 一 个 属性 
get { 


return degreeDays; 
} 
set { 
if(value < 0 || value > 30) 
Console.WriteLine ( 
"Value is out of range: {0}", value); 
else 
degreeDays = value; 
} 
} 
private int degreeDays; 


} 


Weather w = new Weather(); 
int degreeDaysToday, oldDegreeDays; 


w.DegreeDays = degreeDaysToday; 


oldDegreeDays = w.DegreeDays; 





曲 第 12 章 将 讨论 protected 存 取 修 饰 符 。 
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在 类 Weather 中 定义 了 属性 DegreeDays。 这 个 属性 提供 了 一 个 获取 器 方法 以 及 一 个 设置 


器 方法 ， 用 于 存 取 私有 的 数据 成 员 degreeDays。 在 类 定义 后 的 客户 代码 中 ， 对 于 degreeDays 


下 


的 处 理 方式 ， 就 像 它 是 一 个 公有 的 成 员 变 量 一 样 ， 虽 然 只 有 通过 属性 才能 够 存 取 degreeDays。 
注意 在 设置 方法 中 隐 式 变量 value 的 使 用 。 这 正 是 使 用 属性 中 新 的 值 的 机 制 。 

如 曾 在 11.4.2 节 中 所 提 到 的 ，C++ 中 包括 了 类 与 结构 这 两 种 近乎 相同 的 结构 。 它 们 之 间 的 唯 
一 差别 是 用 于 类 的 默认 存 取 修 饰 符 是 private， 而 用 于 结构 的 默认 存 取 修饰 符 是 public。C# 
中 也 具有 结构 〈struct) ， 但 这 些 结构 与 在 C++ 中 的 十 分 不 同 。 在 C# 中 的 结构 ， 在 某 种 程度 上 是 
轻 量 级 的 类 。 这 些 结构 可 以 具有 构造 国 数 、 属 性 、 方 法 以 及 数据 领域 ， 并 且 还 可 以 实现 接口 ， 
然而 却 不 支持 继承 。 在 C# 中 的 结构 与 类 之 间 另 外 的 一 种 根本 区 别 是 结构 为 数值 类 型 而 不 是 引用 
类 型 。 结 构 被 分 配 于 运行 时 的 栈 上 ， 而 不 是 被 分 配 于 堆 上 。 如 果 将 这 些 结构 作为 参数 来 传递 ， 
它们 是 按 值 传递 的 。C# 中 的 所 有 数值 类 型 ， 包 括 它 的 所 有 基本 类 型 ， 实 际 上 都 是 结构 。 虽 然 这 
样 看 起 来 十 分 奇怪 ， 通 过 使 用 new 操 作 符 来 创建 结构 对 象 ， 就 与 创建 类 对 象 的 方式 一 样 。 

在 C# 中 所 使 用 的 结构 ， 主 要 用 于 实现 相对 小 型 的 类 型 ， 这 些 类 型 不 是 用 于 继承 的 基本 类 型 。 
当 类 型 的 对 象 是 在 栈 上 而 非 堆 上 分 配 时 ， 使 用 这 些 结构 也 较为 方便 。 


11.4.5 ” Ruby 的 抽象 数据 类 型 


Ruby 对 它 的 类 提供 了 完整 的 抽象 数据 类 型 支持 。Ruby 类 与 Ct++ 和 Java 类 非常 相似 。 

在 Ruby 里 ， 通 过 使 用 开头 带 class 保 留 字 的 复合 语句 来 定义 类 。 局 部 变量 名 有 其 他 程序 设 
计 语 言 中 变量 名 的 形式 。 实 例 变量 名 以 标记 6 开始 。 类 有 以 两 个 标记 ee 开头 作为 名 称 的 类 变量 
(它们 与 类 关联 ， 而 不 是 实例 )。 实 例 方法 有 与 Ruby 函 数 同样 的 语法 。 它 们 以 保留 字 def 开 头 ， 
以 end 结 尾 。 类 方法 与 实例 方法 不 同 之 处 是 实例 方法 名 由 类 方法 名 前 加 分 隔 符 组 成 。 例 如 ， 在 
Stack 类 中 ， 类 方法 名 将 以 Stack 开 头 。Ruby 的 构造 图 数 命名 为 initialize。 它 们 可 以 通过 
定义 多 个 具有 不 同 数量 的 参数 的 原型 来 重 载 。 

类 成 员 能 标记 为 私有 或 公有 (默认 下 为 公有 )。SRuby 的 私有 和 公有 访问 权限 与 Java 完 全 相 
同 。 所 有 的 数据 成 员 必须 指定 为 私有 以 支持 信息 隐藏 。 

Ruby 的 类 是 动态 的 ， 这 意味 着 成 员 能 够 动态 添加 。 简 单 地 包括 指定 新 成 员 的 附加 类 定义 就 
可 以 完成 动态 添加 。 当 然 ， 方 法 也 可 能 从 类 中 删除 ， 这 可 以 通过 提供 另 一 个 类 定义 ， 即 把 要 删 
除 的 方法 作为 参数 发 送 给 方法 remove_method 来 完成 。Ruby 的 动态 类 是 语言 设计 人 员 把 可 读 
性 (和 可 靠 性 ) 换 为 灵活 性 作为 语言 取舍 的 另 一 个 例子 。 人 允许 类 的 动态 改变 显而易见 地 增加 了 
语言 的 灵活 性 ， 但 却 减 小 了 其 可 读 性 。 为 了 决定 当前 类 的 定义 方式 ， 我 们 必须 发 现 程序 中 所 有 
的 定义 并 通盘 考虑 它们 。 

下 面 例子 是 用 Ruby 语 言 编写 的 栈 : 

: Stack.rb - 定义 和 测试 一 个 最 大 长 度 为 100， 由 数组 实现 的 栈 

class StackClass 


# 构造 器 


def initialize 
@stackRef = Array.new 


O Ruby 也 支持 保护 访问 模式 ， 这 将 在 第 12 章 中 讨论 。 
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@maxLen = 100 
@topIndex = -1 
end 


# push 方 法 


def push(number) 
if @topIndex == @maxLen 
puts "Error in push - stack is full" 
else 
@topIndex = @topIndex + 1 
@stackRef [ €topIndex] = number 
end 
end 


# Pop 方 法 


def pop 
if @topIndex == -1 
puts "Error in pop - stack is empty" 
else 
@topIndex = @topIndex - 1 
end 
end 


# 七 op 方法 


def top 
@stackRef [ @topIndex] 


end 
# empty 方 法 
def empty 
@topIndex == - 
end 
end # of Stack class 


# StackClass 的 测试 代码 


myStack = StackClass.new 
myStack. push (42) 


myStack.push(29) 
puts "Top element is (should be 29): #{myStack.top} 
myStack.pop i 
puts "Top element is (should be 42): #{mystack.top} 
myStack.pop 


# 下 面 的 pop 应 该 产生 一 个 

# 错误 信息 一 栈 为 空 

回忆 一 下 ， 注 释 #{ 变 量 } 转 换 变量 值 为 字符 串 ， 然 后 把 它 插入 到 字符 串 出 现 的 地 方 ， 该 类 
定义 了 能 存储 任何 类 型 对 象 的 栈 结构 。 前 面 讲 过 ，Ruby 中 的 一 切 都 是 对 象 ， 数组 实际 上 是 对 对 
角 引 用 的 数组 。 显 而 易 见 地 ， 这 使 上 面 的 栈 比 Ada、 C++ 和 Java 例 子 中 出 现 的 栈 更 灵活 。 而 且 ， 
通过 简单 地 把 要 求 的 最 大 长 度 传递 给 构造 器 ， 此 类 的 对 象 能 具有 任何 给 定 的 最 大 长 度 。 当 然 ， 
因为 Ruby 数 组 的 长 度 能 动态 改变 ， 所 以 类 能 改变 实现 栈 对 象 的 任何 长 度 ， 除非 机 器 存储 器 容量 
的 限制 。 
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11.5 有 参数 的 抽象 数据 类 型 


如 果 能 将 抽象 数据 类 型 参数 化 常常 是 很 方便 的 。 例 如 ， 我 们 应 该 能 够 设计 一 个 栈 抽象 数据 

py 类 型 ， 它 可 以 存储 任何 数量 类 型 的 元 素 ， 而 不 应 该 被 要 求 为 每 一 个 不 同 的 数量 类 型 ， 都 编写 一 

42 个 单独 的 栈 抽象 。 在 下 面 的 两 节 中 ， 我 们 将 讨论 Ada, C++, Java 5.0 和 C# 2005 中 构造 有 参数 
的 抽象 数据 类 型 的 能 力 。 


11.5.1 Ada 


关于 Ada 中 的 通用 过 程 ， 也 曾经 在 第 9 章 中 讨论 过 。 包 也 可 以 是 通用 的 ， 因 而 我 们 也 可 以 构 
造 通用 的 或 是 有 参数 的 抽象 数据 类 型 。 

曾 在 11.4.1 市 中 所 显示 的 ，Ada 的 栈 抽象 数据 类 型 示例 ， 受 到 两 种 限制 ，(1) 这 种 类 型 的 栈 
只 能 够 存储 整数 类 型 的 元 素 ，(2) 这 种 栈 最 多 只 能 具有 100 个 元 素 。 通 过 使 用 一 个 通用 包 ， 就 能 
够 消除 这 两 种 限制 ， 从 而 栈 可 以 被 实例 化 为 其 他 的 元 素 类 型 以 及 任何 期 望 的 大 小 。( 这 是 一 种 通 
用 的 实例 化 ， 这 种 实例 化 与 一 个 类 创建 对 象 的 实例 化 十 分 不 同 。) 下 面 的 说 明 包 描 述 一 个 具有 这 
些 特性 的 通用 栈 抽象 数据 结构 的 接口 : 


generic 
Max Size : Positive; -- 一 种 记录 栈 的 大 小 的 通用 参数 
type Element Type is private; -- 一 种 用 于 元 素 类 型 的 通用 参数 


package Generic Stack is 
-- 可 见 的 实体 ， 或 者 是 公有 的 接口 
type Stack Type is limited private; 
function Empty(Stk : in Stack Type) return Boolean; 
procedure Push(Stk : in out Stack Type; 
Element : in Element Type); 
procedure Pop(Stk : in out Stack Type) ; 
function Top(Stk : in Stack Type) return Element Type; 
-- 隐藏 的 部 分 
private 
type List_Type is array (1..Max Size) of Element Type; 
type Stack Type is 
record 
List : List Type; 
Topsub : Integer range 0..Max Size := 0; 
end record; 
end Generic Stack; 


Genezric_Stack 的 体 包 与 在 前 一 节 中 的 Stack Pack 的 体 包 相 同 ， 除了 在 Push 和 mTop 中 
形 参 Element 的 类 型 是 Element _Type 而 不 是 Integer 以 外 ， 
下 面 这 条 语句 将 Generic_stack 实 例 化 为 一 个 具有 100 个 元 素 的 Integer 类 型 的 栈 ， 


49] package Integer Stack is new Generic Stack(100, Integer); 


入 们 也 可 以 构造 一 个 长 度 为 5300 元 素 的 FLoat 类 型 的 栈 ， 如 


package Float_Stack is new Generic Stack(500, Float); 
这 些 实 例 化 在 编译 时 构造 了 Generic_stack 的 两 种 不 同 的 源 代码 版 本 。 
11.5.2 C++ 
C++ 也 支持 有 参数 的 或 是 通用 的 抽象 数据 类 型 。 为 了 使 在 11.4.2 节 中 的 C++ 栈 类 的 示例 在 栈 
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的 大 小 方面 通用 化 ， 只 需要 改变 其 中 的 构造 函数 。 如 下 所 示 : 


stack(int size) { 


stkPtr = new int [size]; 
maxLen = size - 1; 
top = -l; 

} 


现在 ， 一 个 栈 对 象 的 声明 就 可 以 是 : 

stack stk(150); 

stack 的 类 定义 可 以 包括 两 个 构造 函数 ， 从 而 用 户 可 以 使 用 默认 大 小 的 栈 ， 或 者 是 说 明 别 
的 大 小 。 

我 们 可 以 通过 将 这 个 类 构造 成 为 模板 类 ， 而 使 栈 元 素 的 类 型 成 为 通用 的 。 那 么 ， 这 个 元 素 
类 型 就 可 以 是 一 个 模板 参数 。 一 个 栈 类 型 的 模板 类 的 定义 为 ; 


#include <iostream.h> 
template <class Type> // Type 是 模板 参数 
class stack { 
private: 
Type *stackPtr; 
int maxLen; 
int topPtr; 
public: 
// 100 个 元 素 的 构造 器 
stack() { 
stackPtr = new Type [100]; 
maxLen = 99; 
topPtr = -1; 
} 
// 给 定 元 素数 目的 构造 器 
stack(int size) { 
StackPtr = new Type [size]; 
maxLen = size - 1; 
topPtr = -1; 
} 
~stack() {delete stackPtr;}; // 一 个 析 构 器 
void push(Type number) { 
if (topPtr == maxLen) 
cout << "Error in push—-stack is full\n"; 


else stackPtr[++ topPtr] = number; 
} 
void pop() { 

if (topPtr == -1) 


cout << "Error in pop—stack is empty\n"; 
else topPtr --; 


} 
Type top() {return (stackPtr[topPtr]);} 
int empty() {return (topPtr == -1);} 


} 

如 同 在 Ada 中 一 样 ， 在 编译 时 将 C++ 中 的 模板 类 实例 化 。 其 差别 在 于 C++ 中 的 实例 化 是 隐 式 
的 : 当 创 建 一 个 对 象 时 ， 如 果 它 需要 的 一 个 模板 类 的 版 本 ， 而 目前 这 个 版 本 还 不 存在 ， 即 会 产 
生 这 个 版 本 的 一 个 新 实例 。 
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11.5.3 Java 5.0 


Java 5.0 支 持 一 种 有 参数 的 抽象 数据 类 型 形式 ， 其 通用 参数 必须 是 类 。 第 9 章 曾 向 要 讨论 过 它 。 

最 常用 的 通用 类 型 是 集合 (collection) 类 型 ， 如 LinkedList 和 ArrayList， 它 们 都 是 在 
通用 支持 出 现 以 前 的 Java 类 库 。 集 合 类 型 存储 Object 类 对 象 ， 因 此 它们 能 存储 任何 对 象 〈 但 不 
是 基本 类 型 ) 。 集 合 类 型 总 是 能 存储 多 种 类 型 (只 要 它们 是 类 )。 但 是 ， 它 也 存在 3 个 问题 : 第 一 ， 
在 每 次 从 集合 中 删除 对 象 时 ， 必 须 进行 正确 的 类 型 转换 。 第 二 ， 在 把 元 素 添加 到 集合 时 没有 错 
误 检 查 机 制 。 这 意味 着 ,一 旦 创建 了 集合 ， 则 任何 类 的 对 象 都 能 添加 到 集合 中 。 第 三 ， 集合 类 
型 不 能 存储 基本 类 型 。 因 此 ， 为 了 在 ArrayList 中 存储 int 值 ， 必 须 首 先 把 值 放 入 Integer 类 

493| ”对 象 中 。 例 如 ， 考 虑 下 面 的 代码 : 


ArrayList myArray = new ArrayList();//* Create an ArrayList 

myArray.add(0, new Integer(47)); //* Create an element 

Integer myInt = (Integer)myArray.get(0); //* Get first object 

在 Java 5.0 中 ， 最 常 使 用 的 集合 类 (List, ArrayList#lQueve) 变 成 了 通用 类 。 这 些 类 
通过 调用 类 构造 器 的 new 并 将 其 传递 给 指 回 括号 内 的 通用 参数 来 完成 实例 化 。 例 如 ， 
Arraylist 类 能 实例 化 为 下 面 语句 的 存储 Integer 对 象 : 


Arraylist <Integer> myArray = new ArrayList <Integer>(); 


该 类 克服 了 Java 5.0 之 前 的 集合 的 两 个 问题 。 只 有 Integer 对 象 能 放 和 myRArray 集 合 中 。 而 
且 ， 它 不 需要 在 集合 中 删除 对 象 时 进行 类 型 转换 。 然 而 ， 实 例 化 存储 基本 类 型 的 通用 集合 仍然 
FEA Fy BER 

第 9 章 讲 过 Java 5.0 支 持 通 配 类 。 例 如 ，collection<?> 是 可 提供 给 所 有 集合 类 的 通 配 类 。 它 
允许 编写 能 接收 任何 集合 类 型 作为 其 参数 的 方法 。 因 为 集合 自己 是 通用 的 ， 所 以 Collection<?> 
类 在 某 种 意义 上 是 通用 的 通用 类 。 

使 用 通 配 类 型 的 对 象 必 须 小 心 。 例 如 ， 因 为 这 种 类 型 的 特定 对 象 的 组 成 部 分 具有 类 型 ， 所 
以 其 他 类 型 的 对 象 不 能 添加 到 该 集合 中 。 人 例如， 考虑 : 


Collection<?> c = new ArrayList<String>(); 


使 用 aqdq 方 法 把 一 些 方法 等 放 人 集合 将 是 非法 的 ， 除 非 其 类 型 为 String。 
用 户 能 定义 Java 5.0 的 通用 类 。 这 是 一 个 渐进 的 过 程 ， 这 种 类 的 表现 像 预定 义 通用 类 的 行为 。 


11.5.4 C# 2005 


正如 Java 的 例子 ，C# 的 第 一 版 定义 集合 类 为 存储 任何 类 的 对 象 。ArrayList、Stack 和 
Queue 这 些 类 有 与 Java 5.0 之 前 版 本 相同 的 问题 。 

通用 类 添加 到 了 C# 2005 中 ，5 个 预定 义 通用 集合 为 Array、List、Stack、Queue 和 
Dictionary (Dictionary 类 实现 散 列 )。 也 正如 Java 5.0 一 样 ， 这 些 类 清除 了 在 集合 中 允许 混合 
类 型 和 把 对 象 从 集合 中 删除 需要 进行 类 型 转换 的 问题 。 

正如 Java 5.0， 用 户 能 在 C# 2005 中 定义 通用 类 。 一 个 用 户 定 义 C# 通 用 集合 的 功能 是 它们 都 
能 定义 为 允许 索引 其 元 素 〈 通 过 下 标 访问 ) 。 尽 管 索引 通常 都 是 整数 ， 但 是 也 可 以 使 用 字符 串 替 

Java 5.0 提 供 了 通 配 类 的 功能 ， 而 C# 2005 却 没有 提供 。 
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11.6 封装 结构 


本 章 前 五 个 章 市 所 讨论 的 抽象 数据 类 型 ， 是 一 些小 型 的 封装 。° 这 一 节 将 描述 大 型 程序 所 
需要 的 多 类 型 的 封装 。 


11.6.1 介绍 


当 一 个 程序 的 规模 超过 数 千 行 时 ， 就 会 出 现 两 种 实际 问题 。 从 程序 人 员 的 角度 来 看 ， 如 果 
仅仅 将 一 个 程序 视 为 一 些 子 程序 的 集合 ， 或 者 是 一 些 抽象 数据 类 型 定义 的 集合 ， 那 么 这 个 程序 
网 没有 适当 的 程序 组 织 层次 以 保持 它 的 可 管理 性 。 大 型 程序 的 第 二 种 实际 问题 ， 是 重新 编译 问 
题 。 在 小 程序 的 情形 下 ， 每 一 次 修改 之 后 重新 编译 整个 程序 的 代价 并 不 高 。 然 而 对 于 大 型 的 程 
序 ， 重 新 编译 的 代价 就 是 巨大 的 。 因 而 显然 就 有 必要 找到 方法 来 避免 重新 编译 那些 没有 改变 的 
程序 部 分 。 对 于 这 两 种 问题 的 一 种 明显 的 解决 办 法 是 将 程序 组 织 成 为 一 系列 逻辑 上 相关 联 的 代 
码 与 数据 的 组 合 ， 可 以 单独 地 编译 其 中 的 每 一 个 组 合 ， 而 不 需要 编译 程序 的 其 余部 分 。 一 个 圭 
装 ， 就 是 这 样 的 一 个 组 合 。 

通常 将 封装 放置 在 程序 库 内 ， 并 且 提 供给 编写 这 些 封装 之 外 的 其 他 程序 重复 使 用 。 人 们 纺 
写 超过 几 千 行 的 程序 已 有 40 余 年 的 历史 ， 因 而 提供 封装 的 技术 也 已 经 发 展 了 许多 年 ， 


11.6.2 REBATE 
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PH, BEEKE EEZP. Ada, Fortran 95、Python 和 Ruby 就 是 这 样 实行 的 ， 
然而 ， 正 如 在 第 5 章 曾 经 讨论 过 的 ， 这 种 使 用 静态 作用 域 的 组 织 程序 的 方式 ， 远 非 理 想 。 因 和 而， 
即使 在 允许 嵌 套 的 子 程序 的 语言 中 ， 也 并 没有 将 它们 作为 主要 的 组 织 封装 结构 。 


11.6.3 C 中 的 封装 


C 并 不 提供 对 于 抽象 数据 类 型 的 有 力 支持 ， 虽 然 在 C 中 可 以 模拟 抽象 数据 类 型 和 多 类 型 的 
H. 

在 C 中 ， 可 以 将 相关 的 函数 和 数据 的 定义 ， 放置 在 一 个 可 以 独立 编译 的 文件 中 。 这 种 作用 
相当 于 程序 库 的 文件 具有 对 于 其 实体 的 一 种 实现 。 将 这 个 包括 了 数据 、 类 型 和 函数 声明 的 文件 
接口 ， 放 置 在 另外 一 个 单独 的 、 称 为 头 文件 的 文件 之 中 。 通 过 在 头 文件 中 ， 将 类 型 表示 定义 为 
指向 一 些 结构 类 型 的 指针 ， 就 可 以 将 类 型 表示 隐藏 起 来 。 关 于 这 些 结构 类 型 的 完整 定义 ， 将 仅 
仅 出 现在 实现 文件 之 中 。 这 样 的 一 种 方式 ， 具 有 与 在 Ada 的 包 中 使 用 指针 作为 抽象 数据 类 型 时 
同样 的 缺点 ， 即 指针 内 在 固有 的 问题 ， 以 及 指针 赋值 与 指针 比较 所 可 能 带 来 的 混淆 ， 

以 源 程序 形式 存在 的 头 文件 以 及 实现 文件 的 编译 版 本 ， 将 被 配备 给 客户 。 当 使 用 这 种 程序 
库 时 ， 通 过 使 用 一 种 预 处 理 说 明 : #include， 就 将 这 个 头 文件 包括 进 了 客户 代码 之 中 ， 并 且 ， 
在 客 己 代码 中 对 于 国 数 和 数据 的 引用 ， 都 将 经 过 类 型 检测 。 预 处 理 说 明 #include 也 证 明了 客 
户 程 序 依赖 于 程序 库 实现 文件 的 事实 。 这 种 方式 有 效 地 将 一 个 封装 的 说 明 与 实现 分 离开 来 

这 种 类 型 的 封装 虽然 有 效 。 但 也 产生 了 一 些 安全 问题 。 例 如 ， 一 个 用 户 可 以 不 使 用 
#include， 而 仅仅 是 将 头 文件 中 的 定义 裁剪 并 复制 到 客户 的 程序 中 去 。 这 样 也 会 行 得 通 ， 因 
为 #include 无 非 就 是 将 它 的 操作 数 文件 中 的 内 容 ， 复 制 到 出 现 了 #inc1lude 的 文件 之 中 。 然 


日 ”在 Ada 中 ， 可 以 将 包 的 封装 用 于 单 类 型 ， 也 可 以 用 于 多 类 型 。 


p 
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fd, RAHUL, Bt, BA TR PRR ERE (及 其 头 文件 ) 的 证 明 。 其 次 ， 
程序 库 的 编写 人 员 可 能 会 修改 头 文件 和 实现 文件 ， 客 户 使 用 的 就 会 是 新 的 实现 文件 (即使 并 不 
知道 它们 已 经 被 修改 了 ) ， 再 加 上 用 户 复制 到 客户 程序 中 的 旧 的 头 文件 。 例 如 ， 如 采 客 户 仍旧 使 
用 的 是 在 旧 的 头 文件 中 的 变量 定义 : x 为 int 类 型 ， 尽 管 实现 代码 已 经 与 新 的 头 文件 被 重新 编译 
过 了 ， 而 在 新 的 头 文件 中 ， 变 量 x 被 定义 为 float 类 型 。 从 而 ， 实 现代 码 将 x 编 译 为 float ， 而 
客户 代码 将 x 编译 为 nt。 连 接 程 序 将 不 会 检测 出 这 个 错误 。 

所 以 ， 用 户 有 责任 来 保证 头 文件 和 实现 文件 都 是 最 近 的 版 本 。 使 用 make 功 能 就 能 够 做 到 这 
— ii» | 


11.6.4 C++ 中 的 封装 


C++ 中 的 封装 类 似 于 C 中 的 封装 。 头 文件 被 用 来 提供 对 于 封装 中 资源 的 接口 。 事 实 上 ， 由 于 
C++ 中 模板 以 及 分 别 编译 所 带 来 的 复杂 的 交互 作用 ，C++ 中 模板 程序 库 的 头 文件 ， 通 闻 包 括 了 
源 程序 的 完整 定义 ， 而 不 仅仅 是 一 些 数据 的 声明 和 子 程序 的 协议 ， 其 中 部 分 的 原因 ， 是 由 于 
C++ 中 的 程序 使 用 了 C 语 言 的 连接 器 。 

因为 具有 类 但 又 不 具有 一 般 的 封装 结构 ， 这 样 所 导致 的 一 种 语言 设计 问题 是 ， 当 单个 对 象 
与 对 象 操 作 相关 联 时 ， 并 不 总 是 那么 自然 。 例 如 ， 假 设 我 们 有 一 个 用 于 和 矩阵 的 抽象 数据 类 型 ， 
以 及 一 个 用 于 矢量 的 抽象 数据 类 型 ， 而 需要 进行 一 个 矩阵 与 一 个 矢量 间 的 乘法 操作 。 这 个 乘 
法 操作 的 代码 ， 必 须 能 够 存 取 矢量 类 以 及 和 矩阵 类 的 数据 成 员 ， 但 这 两 个 类 都 不 是 这 上段 代码 的 
自然 归属 。 加 之 不 论 是 选择 了 它们 中 的 哪 一 个 ， 在 存 取 另 外 一 个 类 的 成 员 时 ， 都 会 出 现 问题 。 
在 C++ 中 ， 则 可 以 通过 允许 非 成 员 函 数 成 为 一 个 类 的 “ 友 元 ”(friend) 来 处 理 这 种 类 型 的 情况 。 
友 元 函数 对 于 在 其 中 将 它 声 明 为 友 元 的 类 ， 能 够 来 存 取 这 个 类 的 私有 实体 。 对 于 矢量 与 矩阵 
间 的 乘法 操作 ，C++ 中 的 一 种 解决 办 法 ， 是 将 这 个 操作 定义 在 这 两 个 类 一 一 矢量 类 以 及 和 矩阵 类 
的 外 部 ， 但 是 将 这 个 操作 定义 为 这 两 个 类 的 友 元 。 下 面 的 代码 框架 介绍 了 这 种 现象 : 

class Matrix; //** 一 个 类 声明 


class Vector { 
friend Vector multiply(const Matrix&, const Vector&); 


}; 
class Matrix { //** 类 定义 
friend Vector multiply(const Matrix&, const Vector&); 


}; 

//** 使 用 矢量 及 矩阵 对 象 的 函数 

Vector multiply(const Matrix& ml, const Vectorg vl) { 

} 

除了 函数 外 ， 还 可 以 将 整个 类 定义 为 一 个 的 友 元 ， 那么 ， 这 个 类 的 所 有 私有 成 员 对 于 友 元 
类 的 成 员 都 是 可 见 的 。 
11.6.5 Ada 中 的 包 


Ada 中 的 说 明 包 ， 可 以 在 它 的 公有 与 私有 段 中 ， 包 括 任意 数目 的 数据 和 子 程序 的 声明 。 因 
而 ， 它 们 也 就 可 以 包括 任意 数目 的 抽象 数据 类 型 的 接口 ， 以 及 任何 其 他 程序 资源 。 所 以 ， 包 是 
一 种 多 类 型 的 封装 结构 。 


Ada 中 的 包 可 以 被 分 别 编译 。 如 果 首 先 编译 的 是 说 明 包 ， 那 么 包 中 的 说 明 与 体 这 两 个 部 分 
也 是 分 别 编译 的 。 一 个 使 用 任意 数目 外 部 的 包 的 完整 程序 ， 也 可 以 被 分 别 编译 ， 只 要 是 编译 了 
所 有 被 使 用 的 包 的 说 明 。 这 些 被 使 用 的 包 的 体 ， 则 可 以 在 客户 程序 被 编译 之 后 ， 再 进行 编译 。 

考虑 在 11.6.4 小 节 中 所 描述 的 矢量 与 矩阵 类 型 的 情形 ， 并 且 考 虑 需要 一 种 方法 来 存 取 这 两 种 
类 型 中 的 私有 部 分 ， 在 C++ 中 是 通过 友 元 函数 来 处 理 的 。 在 Ada 中 ， 则 可 以 将 矢量 和 算 阵 都 同时 
定义 在 一 个 单个 的 Ada 包 中 ， 从 而 避免 使 用 友 元 函数 的 需要 。 


11.6.6 C# 中 的 汇编 


C# 中 包括 了 一 种 比 类 更 大 的 封装 结构 。 在 这 种 情形 下 ， 这 种 结构 是 为 所 有 的 .NET 程序 设 
计 语 言 所 使 用 : 即 汇 编 。 一 个 汇编 是 一 个 文件 或 多 个 文件 的 一 种 组 合 。 这 些 文件 是 作为 单个 的 
动态 连接 程序 库 或 是 一 个 可 执行 文件 (.EXE) ， 出 现 于 应 用 程序 之 中 。 每 一 个 文件 定义 一 个 可 
以 分 别 开 发 的 模块 。 一 个 动态 链接 程序 库 (DLL) ， 是 一 组 类 或 方法 ;在 执行 时 如 果 有 需要 ， 可 
以 将 这 些 类 或 方法 与 执行 程序 单独 连接 。 因 而 ， 虽 然 一 个 程序 可 以 存 取 一 个 DLL 中 的 所 有 资源 ， 
但 只 有 实际 使 用 的 部 分 将 被 装载 连接 到 程序 之 上 。 自 从 视窗 出 现 以 来 ， 这 些 DLL 就 是 视窗 程序 
设计 环境 中 的 部 分 。 作 为 其 资源 的 对 象 代码 的 添加 部 分 ， 一 个 .NET 的 汇编 包括 一 个 清单 ， 这 个 
清单 列 出 所 包括 的 每 一 个 类 的 类 型 定义 ， 汇 编 中 其 他 资源 的 定义 ， 还 有 这 个 汇编 中 所 有 汇编 引 
用 的 表 列 以 及 一 个 汇编 的 版 本 号 码 。 

在 .NET 的 世界 里 ， 汇 编 是 软件 采用 的 基本 单位 。 汇 编 可 以 是 私有 的 ， 此 时 就 只 能 够 将 它们 
用 于 某 一 种 应 用 ， 或 者 是 公有 的 ， 这 时 就 意味 着 可 以 将 它们 用 于 任何 应 用 。 

如 前 所 述 ，C# 还 具有 一 个 存 取 修饰 符 ，internal。 一 个 类 的 ijnternal 成 员 在 它 所 出 现 
的 汇编 中 对 于 所 有 的 类 都 是 可 见 的 。 

因为 一 个 汇编 是 一 个 自我 包括 的 可 执行 单位 ， 它 只 能 具有 一 个 入 口 。 


11.7 命名 封装 


我 们 认为 ， 封 装 是 用 于 逻辑 上 关联 的 软件 资源 一 特别 是 用 于 抽象 数据 类 型 的 一 些 语 法 容 
绩 。 封 北 的 目的 是 提供 将 程序 组 织 成 一 些 便于 编译 的 逻辑 单位 的 一 种 方式 。 这 个 步骤 允许 程序 
的 部 分 在 孤立 的 修改 之 后 ， 被 重新 进行 编译 。 还 有 另外 的 一 种 用 来 构造 大 型 程序 的 封装 ， 即 命 
名 封装 。 

一 个 大 型 程序 可 能 由 许多 人 员 来 编写 ， 他 们 在 某 种 程度 上 独立 的 工作 ， 也 许 甚至 是 在 不 同 
的 地 理 位 置 。 这 就 要 求 程序 的 逻辑 单位 是 独立 的 ， 但 又 能 够 一 起 工作 。 这 也 就 产生 了 命名 的 问 
题 : 这 些 独立 工作 的 开发 人 员 ， 怎 么 能 够 为 他 们 的 变量 、 方 法 和 类 来 创建 名 字 ， 而 不 至 于 意外 
地 使 用 一 些 已 经 被 开发 同一 个 软件 系统 不 同 部 分 的 程序 人 员 使 用 了 的 名 字 。 

取 早 存在 着 此 类 命名 问题 的 是 程序 库 。 在 过 去 的 两 个 年 代 ， 大 型 的 软件 系统 越 来 越 依赖 于 
支持 软件 的 程序 库 。 几 乎 所 有 使 用 当代 程序 设计 语言 所 编写 的 软件 ， 除 了 使 用 应 用 特定 的 程序 
库 外 ， 都 要 求 使 用 大 型 而 又 复杂 的 标准 程序 库 。 多 程序 库 的 广泛 使 用 ， 使 得 管理 名 字 的 新 机 制 
成 为 必然 。 例 如 ， 当 一 个 程序 人 员 给 一 个 现存 的 程序 库 或 新 的 程序 库 增加 一 些 新 名 字 时 ， 他 或 

肯定 不 能 够 使 用 一 个 在 客户 的 应 用 程序 中 或 在 某 些 其 他 的 程序 库 中 ， 已 经 定义 了 的 名 字 。 如 
朱 没 有 一 些 语言 学 方面 的 帮助 ， 这 简直 是 不 可 能 的 事 ， 因 为 程序 库 的 编写 人 员 不 可 能 知道 一 个 
客户 程序 使 用 了 什么 名 字 ， 或 者 是 客户 可 能 使 用 的 其 他 的 程序 库 定义 了 什么 名 字 。 

命名 封装 定义 一 些 名 字 作用 域 帮 助 避 免 这 种 名 字 冲 突 。 每 一 个 程序 库 可 以 创建 它 自 己 的 命 
名 封闭 ， 以 便 防止 自己 的 名 字 与 其 他 程序 库 中 定义 的 名 字 相 冲突 ， 或 与 客户 代码 中 所 定义 的 名 
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字 相 冲突 。 为 了 同样 的 目的 ， 一 个 软件 系统 中 的 各 个 部 分 也 可 以 创建 一 个 命名 封闭 。 

基于 命名 封装 是 非 连续 的 意义 ， 命 名 封装 是 一 些 逻辑 封装 。 可 以 将 几 种 不 同 组 合 中 的 代码 ， 
放置 于 同一 个 名 称 空间 ， 尽 管 这 些 代 码 的 存储 空间 是 不 同 的 。 在 下 面 小 节 的 讨论 中 ， 我 们 将 简 
略 地 描述 在 C++、Java、Ada 和 Ruby 语 言 中 ， 关 于 命名 封装 的 使 用 。 


11.7.1 C++ 中 的 名 称 空间 


C++ 包 括 一 种 称 为 名 称 空 间 的 说 明 ， 以 帮助 程序 来 管理 全 局 名 称 空间 的 问题 。 当 在 名 称 空 
间 以 外 使 用 这 些 程序 中 的 名 字 时 ， 人 们 可 以 将 每 一 个 程序 库 放 置 在 它 自己 的 名 称 空间 中 ， 并 使 
用 名 称 空间 中 的 名 字 将 程序 中 的 这 些 名 字 限 定 。 例 如 ， 假 设 有 一 个 抽象 数据 类 型 的 头 文件 ， 是 
为 实现 栈 的 。 如 果 担 心 其 他 的 程序 库 文件 可 能 会 定义 一 个 已 经 在 这 个 栈 抽象 数据 类 型 中 使 用 了 
的 名 字 ; 就 可 以 将 定义 栈 的 文件 ， 放 置 在 它 自 己 的 名 称 空间 之 中 。 这 可 以 通过 将 这 个 栈 的 所 有 
声明 都 放置 在 一 个 名 称 空间 的 块 中 来 完成 ， 如 

namespace MyStack { 

// 栈 的 声明 

} 

栈 抽象 数据 类 型 的 实现 文件 就 可 以 使 用 在 头 文件 中 使 用 作用 域 决议 操作 符 一 一 : :声明 的 这 
些 名 字 ， 如 : 

MyStack: :topPtr 


这 个 实现 文件 也 可 以 出 现在 一 个 名 称 空间 的 块 说 明 中 ， 这 种 说 明 与 在 头 文件 中 所 使 用 
的 说 明 一 模 一 样 ， 这 就 使 得 所 有 在 头 文件 中 所 声明 的 名 字 ， 成 为 直接 可 见 的 。 这 种 方法 的 
确 简单 ， 然 而 可 读 性 稍 差 ， 因 为 这 并 没有 明显 地 说 明 ， 在 实现 文件 中 声明 某 一 特定 名 字 的 
位 置 。 

客户 的 代码 可 以 通过 三 种 方式 对 于 一 个 程序 库 的 头 文件 中 名 称 空间 的 名 字 进 行 存 取 。 一 种 
方式 ， 是 使 用 名 称 空间 的 这 个 名 字 来 限定 程序 库 中 的 这 些 名 字 。 例 如 ， 一 种 对 于 变量 toPPtT 
的 引用 ， 可 以 显示 为 : 


MyStack: :topPtr 

这 正 是 实现 代码 引用 这 个 变量 的 方式 。 

另外 的 两 种 方式 ， 是 运用 using 指 示 的 方式 。 可 以 使 用 这 种 指示 来 限定 来 自 于 某 个 名 字 空 
间 的 单个 的 名 字 ， 如 使 用 语句 : 

using MyStack: :topPtr; 


这 将 使 得 topPtr 成 为 可 见 的 ; 但 是 ， 并 没有 使 得 MyStack 名 称 空 间 的 其 他 名 字 可 见 。 
当然 ， 还 可 以 使 用 using 指 示 来 限定 一 个 名 称 空间 中 的 所 有 名 字 ， 如 下 列 语 句 : 


using namespace MyStack; 
包括 了 这 种 指示 语句 的 代码 ， 就 可 以 直接 地 存 取 在 这 个 名 称 空间 中 定义 的 名 字 ， 如 这 一 条 
语句 : 
p = topPtr; 
必须 知道 ， 名 称 空间 是 C++ 中 的 一 种 复杂 的 特性 ， 我 们 在 这 里 所 描述 的 只 是 其 中 的 简单 
部 分 。 i 
C# 所 包括 的 名 称 空间 十 分 类 似 于 C++ 中 的 名 称 空 间 。 


11.7.2 Java 中 的 包 


Java 中 包括 了 一 种 命名 封装 的 结构 : 包 。 包 可 以 包括 一 种 以 上 的 类 定义 ， 并 且 在 一 个 包 中 
的 类 中 间 ， 彼 此 都 是 部 分 的 友 元 类 。 在 这 里 ,“ 部 分 的 ”意味 着 在 包 的 一 个 类 中 所 定义 的 实体 ， 
或 者 是 公有 的 或 被 保护 的 (参见 第 12 章 )， 或 者 是 不 具有 任何 存 取 说 明 符 ， 这 些 实体 对 于 包 中 的 
所 有 其 他 的 类 ， 都 是 可 见 的 。 一 个 包 只 能 具有 一 种 公有 类 的 定义 。 

将 不 具有 存 取 说 明 符 的 实体 称 为 具有 包 作 用 域 ， 因 为 它们 在 整个 包 中 都 是 可 见 的 。 因 而 ， 
在 Java 中 很 少 需要 显 式 地 声明 友 元 ， 并 且 它 没有 包括 C++ 中 的 友 元 函数 或 友 元 类 。 

使 用 一 种 包 的 声明 ， 可 以 将 一 个 文件 中 的 资源 定义 说 明 在 一 个 特定 的 包 中 ， 如 下 所 示 : 

package myStack; 

这 种 包 的 声明 必须 出 现在 文件 的 第 一 行 。 在 每 一 个 文件 中 没有 包 声 明 的 资源 ， 都 被 隐 式 地 
放置 在 同一 个 没有 被 命名 的 包 中 。 

一 个 包 的 客户 可 以 通过 使 用 完全 限定 的 名 字 ， 来 引用 在 包 中 定义 的 名 字 。 例 如 ， 如 果 在 
myStack 包 中 定义 了 一 个 变量 topPtr, myStack 包 的 一 个 客户 可 以 引用 这 个 变量 ， 如 ， 
myStack .topPtr。 因 为 当 包 被 能 套 时 ， 这 种 引用 方法 很 快 就 成 为 障碍 ，Java 提 供 了 这 种 
import 声 明 ， 它 允许 缩短 包 中 名 字 的 引用 。 例 如 ， 假 设 客户 包括 了 下 面 的 语句 ; 

import myStack.*; 

现在 ， 就 可 以 仅仅 通过 使 用 名 字 来 引用 变量 topPtr ， 以 及 定义 在 包 myStack 中 的 其 
他 名 字 。 如 采 只 是 从 这 个 包 中 存 取 一 个 名 字 ， 就 可 以 在 这 条 ;import 声明 中 写 出 这 个 特定 的 
AF, HM: 

import myStack.topPtr; 

注意 ，Java 中 的 import 声 明 只 是 一 种 省 略 机 制 。 使 用 import 声 明 并 不 能 够 获取 隐藏 的 外 
部 资源 。 事 实 上 ， 在 Java 中 ， 如 果 可 以 通过 编译 器 或 类 装载 器 (装载 器 使 用 的 是 包 名 称 ， 以 及 
CLASSPATH 坏 境 中 的 变量 ) 找到 的 话 ， 那 么 任何 资源 都 不 是 隐 式 隐藏 的 。 

Java 中 的 import 声 明证 明了 在 import 声 明 中 出 现 包 的 名 称 的 包 的 一 些 依赖 关系 。 如 果 没 
有 使 用 import 声 明 ， 这 些 依赖 关系 是 不 明显 的 。 


11.7.3 Ada 中 的 包 


通常 包括 了 程序 库 的 Ada 的 包 ， 是 在 层次 结构 上 定义 的 ， 这 种 层次 与 文件 的 层次 相对 应 。 
例如 ， 如 果 将 包 subPack 定 义 为 包 Pack 的 子 包 ，subPack 的 代码 文件 将 会 出 现在 存储 Pack 包 
的 目录 的 子 目 录 中 。Java 中 的 标准 类 库 ， 也 被 定义 在 一 个 包 的 层次 结构 中 ， 并 且 还 被 存储 在 一 
个 相对 应 的 目录 层次 之 中 。 

正如 我 们 第 11.4.1 小 节 中 所 讨论 过 的 ， 包 也 定义 名 称 空间 。 对 于 一 个 来 自 于 程序 单位 的 包 ， 
是 通 过 with 子 句 来 获得 可 见 性 的 。 例 如 ， 下 列 语 句 ; 

with Ada.Text_I0; 

wT Af Ada .Text_IO 中 的 资源 和 名 称 空间 能 够 被 使 用 。 对 于 在 Ada .Text I0O 的 名 称 
空间 所 定义 的 名 字 的 存 取 ， 则 必须 被 限定 。 例 如 ， 存 取 来 自 于 ada .Text_I0o 中 的 Put 过 程 ， 必 
须 是 下 面 的 形式 : 

Ada.Text IO.Put 


为 了 不 限定 就 能 够 存 取 Ada .Text_IO 中 的 名 字 ， 就 必须 使 用 use 子 句 , 如 
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use Ada.Text_IO; 
通过 这 条 子 句 ， 就 能 够 存 取 来 自 于 Ada .Text_IO 中 的 Put 过 程 。Ada 中 的 use 子 句 与 Java 
中 的 Import 声明 紧密 关联 。 


11.7.4 Ruby 模 组 


Ruby 类 作为 命名 空间 封装 ， 其 他 支持 面向 对 象 程序 设计 的 语言 的 类 也 如 此 。Ruby 还 有 一 个 
额外 的 命名 封装 ， 称 为 模 组 (module)。 典 型 地 ， 模 组 定义 方法 和 常量 的 集合 。 因 此 ， 模 组 对 于 
封装 有 关联 的 方法 和 常量 是 很 方便 的 ， 这 些 方法 名 和 常量 名 在 相互 隔离 的 命名 空间 里 ， 以 使 其 
不 与 使 用 该 模 组 的 程序 中 的 其 他 名 称 冲 突 。 模 组 与 类 不 同 ， 因 为 它们 不 能 实例 化 或 子 类 化 ,也 
不 能 定义 变量 。 在 模 组 中 定义 的 方法 包括 在 它们 名 称 中 的 模 组 名 。 例 如 ， 考 虑 下 面 的 模 组 定义 
框架 

module MyStuff 


PI = 3.114159265 
def MyStuff.mymeth1 (p1) 


ant 
def MyStuff.mymeth2(p2) 
end 
end 
假定 Mystuff 模 组 存储 在 它 自己 的 文件 中 ， 一 个 想 使 用 Mystuff 方 法 和 常量 的 程序 必须 先 
获得 访问 模 组 的 权限 。 这 可 以 通过 require 方 法 来 完成 ， 它 接收 文件 名 的 字符 串 字 面 常 量 作为 
参数 。 然 后 ， 可 以 通过 模 组 名 访问 模 组 的 常量 和 方法 。 考 虑 下 面 使 用 上 述 模 组 Mystuff 的 代码 ， 
它 存 储 在 命令 为 myStuffMod 的 文件 中 : 


require ‘myStuff£Mod’ 


MyStuff. mymeth1 (x) 


HURR DBE 见 第 12 章 。 
小 结 


抽象 数据 类 型 的 概念 和 它们 在 程序 设计 中 的 应 用 ， 是 工程 领域 程序 设计 发 展 中 的 一 个 里 程 碑 。 尽 管 
这 种 概念 相对 简单 ， 但 是 直到 语言 被 设计 以 便 支持 它 时 ， 它 的 使 用 才 成 为 方便 和 安全 的 。 

抽象 数据 类 型 的 两 个 主要 特性 是 : 将 数据 对 象 及 其 相关 的 操作 包装 在 一 起 ， 和 信息 隐藏 。 一 种 语言 
可 以 二 接地 支持 抽象 数据 类 型 ， 或 者 是 使 用 更 为 一 般 的 封装 来 模拟 抽象 数据 类 型 。 

Ada 提 供 了 可 以 用 来 模拟 抽象 数据 类 型 的 封装 一 一 包 。 包 通常 具有 两 个 部 分 : 一 个 说 明 ， 给 客户 提供 
接口 ， 以 及 一 个 体 ， 它 提供 抽象 数据 类 型 的 实现 。 数 据 类 型 的 表示 ， 可 以 出 现在 说 明 包 中 ， 然 而 通过 将 这 
蛙 表 示 放 置 在 包 的 私有 子 句 中 ， 而 将 它们 对 于 客户 隐藏 起 来 。 在 说 明 包 的 公有 部 分 ， 将 抽象 类 型 的 本 身 定 
义 成 为 私有 的 。 私 有 的 类 型 具有 一 些 内 建 的 操作 ， 用 于 赋值 以 及 等 于 和 不 等 于 的 比较 。 

C++ 在 通过 类 来 提供 数据 抽象 。 类 是 一 些 类 型 ， 类 的 实例 可 以 是 栈 动态 的 或 堆 动态 的 。 一 个 成 员 函 数 
(或 方法 ) 的 完整 定义 ， 可 以 出 现在 类 中 ， 或 者 是 仅仅 将 协议 放置 在 类 中 ， 而 将 定义 放置 在 另外 一 个 可 以 
彼 分 别 编译 的 文件 之 中 。C++ 中 的 类 具有 三 种 子 句 ， 每 一 种 都 将 一 个 存 取 修饰 符 放置 在 前 面 ， 私有 的 、 公 
有 的 和 被 保护 的 。 构 造 函 数 和 析 构 函数 都 可 以 在 类 定义 中 给 出 。 对 于 堆 分 配 的 对 象 ， 必 须 使 用 delete 显 
式 地 解除 分 配 。 
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Java 中 的 数据 抽象 与 C++ 中 的 相 类 似 ， 只 是 所 有 Java 中 的 对 象 都 是 从 堆 中 分 配 ， 并 且 是 通过 引用 变量 
来 存 取 的 。 此 外 ，Java 中 的 所 有 对 象 都 被 废料 收集 。Java 中 的 存 取 修 饰 符 没有 被 附加 在 子 句 里 ， 而 是 出 现 
在 单独 的 声明 或 定义 中 。 

C# 使 用 类 与 结构 来 支持 抽象 数据 类 型 。 其 中 的 结构 是 数值 类 型 的 并 且 不 支持 继承 。 除 此 之 外 ，C# 中 
的 类 与 Java 中 的 相 类 似 。 

Ruby 文 持 抽象 数据 类 型 。Ruby 的 类 与 其 他 大 部 分 语言 的 类 都 不 相同 ， 因 为 它们 是 动态 的 一 一 在 执行 
时 能 添加 、 删 除 或 改变 成 员 。 

Ada, C++, Java 5.0 和 C# 2005 都 允许 它们 的 抽象 数据 类 型 被 参数 化 ，Ada 是 通过 它 的 通用 包 ，C++ 是 
通过 它 的 模板 类 而 Java 5.0 和 C# 2005 通 过 它 的 集合 类 。 

为 了 支持 大 型 程序 结构 ， 一 些 当代 程序 设计 语言 包括 了 多 类 型 的 封装 结构 ， 这 种 结构 可 以 包含 一 组 
多 辑 相 关 的 类 型 。 封 包 还 可 以 提供 对 于 实体 的 存 取 控制 。 封 装 给 程序 人 员 提 供 了 一 种 组 织 程序 的 方法 ， 这 
种 方法 也 有 助 于 重新 编译 。 


C++、C#、Java、Ada 和 Ruby 都 提供 命名 封装 。 对 于 Java 和 Ada， 这 种 封装 是 命名 的 包 ， 而 对 于 CH 


和 C#， 它 们 是 名 称 空间 。 部 分 是 由 于 包 的 可 用 性 ，Java 不 具有 友 元 函数 或 友 元 类 。 在 Ada 中 ， 是 将 包 用 
作 命 名 封装 。 


复习 题 


1. 定义 抽象 数据 类 型 。 

2. 抽象 数据 类 型 定义 中 的 两 个 部 分 有 什么 优点 ? 

3. 对 于 一 种 支持 抽象 数据 类 型 的 语言 ， 语 言 设计 上 的 要 求 是 什么 ? 
4. 什么 是 抽象 数据 类 型 的 语言 设计 问题 ? 

5. 解释 在 Ada 的 包 中 是 怎样 提供 信息 隐藏 的 。 

6. 在 Ada 中 ，private 与 1imited Private 的 类 型 之 间 有 什么 区 别 ? 
7. 在 Ada 的 说 明 包 中 有 什么 ?在 体 包 中 又 有 什么 ? 

8. 在 C++ 中 的 类 与 Ada 中 的 包 之 间 ， 有 哪些 根本 上 的 差别 ? 

9. 一 个 C++ 中 的 成 员 函 数 的 定义 ， 可 以 出 现在 哪些 不 同 的 位 置 ? 
10.C++ 中 构造 函数 的 目的 是 什么 ? 

11. Java 中 的 所 有 方法 都 是 在 什么 地 方 定义 的 ? 

12.C++ 中 的 类 对 象 是 在 哪里 创建 的 ? 

13. Java 中 的 类 对 象 是 在 哪里 创建 的 ? 

14. Java 中 为 什么 没有 析 构 函数 ? 

15. 什么 是 友 元 函数 ?什么 是 友 元 类 ? 

16. Java 没 有 友 元 函数 或 友 元 类 的 一 个 理由 是 什么 ? 

17. Java 中 为 什么 没有 析 构 函数 ? 

18. 描述 C# 中 的 结构 与 它 的 类 之 间 ， 有 哪些 根本 上 的 差别 ? 

19. 在 C# 中 ， 一 个 结构 对 象 是 怎样 创建 的 ? 

20. 请 解释 ， 将 存 取 器 用 于 和 有 类 型 ， 比 将 这 种 类 型 变 为 公有 类 型 要 优越 的 三 个 理由 。 
21. C++ 中 的 结构 与 C# 中 的 结构 之 间 ， 有 什么 差别 ? 

22. 为 什么 Java 语 言 不 象 Ada 语 言 那 样 ， 需 要 一 条 use 子 句 ? 

23. 所 有 Ruby 构 造 器 的 名 称 是 什么 ? 

24. Ruby 的 类 与 C++ 和 Java 的 类 有 什么 根本 的 不 同 ? 

25. 怎样 创建 Ada 中 通用 类 的 实例 ? 

26. 怎样 创建 C++ 中 模板 类 的 实例 ? 
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27. 描述 在 大 型 程序 的 结构 中 所 出 现 的 两 种 问题 ， 正 是 这 两 种 问题 导致 了 封装 结构 的 开发 。 
28. 使 用 C 来 定义 抽象 数据 类 型 会 出 现 什么 问题 ? 

29. C++ 中 的 名 称 空 间 是 什么 ? 它 的 目的 是 什么 ? 

30. 描述 with 子 句 和 use 子 句 的 目的 。 

31. 什么 是 一 个 Java 的 包 ? 它 的 目的 是 什么 ? 

32. 描述 一 个 .NET 的 汇编 。 

33. 在 Ruby 模 组 中 出 现 了 什么 元 素 ? 


练习 题 


1. 一 些 软 件 工程 师 相 信 ， 所 有 的 输入 实体 ， 都 应 该 由 输出 程序 单位 的 名 字 来 限定 。 你 赞同 吗 ? 给 出 理由 
来 支持 你 的 答案 。 
2 假设 有 人 设计 了 一 个 栈 抽象 数据 类 型 ， 其 中 的 函数 top 所 返回 的 ， 是 一 个 访问 途径 或 指针 ， 而 不 是 返 
回 栈 顶 元 素 的 副本 。 这 不 是 一 个 真正 的 数据 抽象 。 为 什么 举例 说 明 。 
3. 分 析 Java 的 包 和 C++ 的 名 称 空间 之 间 的 相似 性 及 差别 。 
4. 将 抽象 数据 类 型 设计 成 为 一 种 指针 ， 具 有 哪些 优越 性 ? 
5. 为 什么 在 Ada 的 说 明 包 中 ， 必 须 给 予 非 指 针 抽象 数据 类 型 的 结构 ? 
6. 相对 于 C++， 在 Java 中 通过 废料 收集 避免 了 什么 样 的 危险 ? 
7. 相对 于 在 C++ 和 Java 中 编写 存 取 器 方法 ， 讨 论 C# 中 的 属性 的 优越 性 。 
8. 解释 C 中 的 封装 方式 的 危险 性 。 
9. 为 什么 在 C++ 中 没有 消除 练习 题 8 中 所 讨论 的 问题 。 
10. 解释 为 什么 命名 封装 对 于 开发 大 型 程序 是 重要 的 。 
11. 描述 一 个 客户 程序 从 C++ 的 名 称 空间 引用 一 个 名 字 的 三 种 方式 。 
12.C# 中 标准 程序 库 的 名 称 空 间 System 对 于 C# 的 程序 并 非 隐 式 可 用 的 。 你 认为 这 是 一 个 好 主意 吗 ? 给 
理由 来 支持 你 的 答案 。 


程序 设计 练习 是 


.设计 本 章 前 面 示例 的 Fortran 抽 象 栈 类 型 ， 将 一 个 具有 多 和信 口 的 单个 子 程序 ， 用 于 类 型 定义 与 操作 的 定义 。 
2. 束 可 靠 性 以 及 灵活 性 方面 ， 将 程序 设计 练习 题 1 中 Fortran 的 实现 与 在 这 一 章 中 的 Ada 的 实现 相 比 较 。 
:在 你 所 知道 的 一 种 语言 中 ， 设 计 一 个 矩阵 抽象 的 抽象 数据 类 型 包括 用 于 加 法 、 减 法 和 抢 阵 乘法 的 
操作 。 

:在 你 所 知道 的 一 种 语言 中 ， 设 计 一 个 队 抽象 数据 类 型 ， 包 括 用 于 入 队 、 出 队 和 判 空 的 操作 。 
.修改 在 本 章 中 出 现 的 、 用 于 抽象 栈 类 型 的 C++ 类 ， 改 为 使 用 链表 来 表示 ， 并 使 用 在 本 章 所 出 现 的 相同 
的 代码 来 进行 测试 。 

.编写 一 个 复数 的 抽象 数据 类 型 ， 包 括 用 于 这 些 运算 的 操作 ， 加 法 、 减法 、 乘 法 、 除 法 、 抽 出 复数 每 一 个 
部 分 ， 以 及 以 两 个 浮 点 常量 、 两 个 变量 或 两 个 表达 式 来 构造 一 个 复数 。 使 用 Ada, C++, Java. C# 或 
Ruby 语 言 。 

.编写 一 个 队 的 抽象 数据 类 型 ， 队 中 的 元 素 存 储 10 个 字符 的 名 字 。 这 个 队 的 元 素 必 须 动态 地 从 堆 中 分 配 。 
队 的 操作 包括 ， 入 队 、 出 队 和 判 室 。 使 用 Ada、C++、Java_ C# 或 Ruby 语 言 。 

.编写 一 个 队 的 抽象 数据 类 型 ， 队 中 的 元 素 可 以 是 任何 基本 类 型 。 使 用 C++ 或 Ada 语 言 。 
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第 12 章 支持 面向 对 象 的 程序 设计 


这 一 音 将 从 介绍 面向 对 象 程序 设计 开始 ， 接 着 对 于 继承 与 动态 绑 定 中 的 主要 设计 问题 进行 
过 论 。 然 后 ， 我 们 将 讨论 Smalltalk，C++、Java、C#、Ada 95 和 Ruby 中 对 于 面向 对 象 程 序 设 计 
的 支持 。 之 后 我 们 将 简略 地 描述 JavaScript 的 对 象 模型 。 在 本 章 的 结尾 ， 是 面向 对 象 程序 设计 语 
言 中 的 方法 调用 与 方法 间 动 态 绑 定 的 实现 。 


12.1 概述 


现在 支持 面向 对 象 的 程序 设计 语言 已 经 稳固 地 进入 了 主流 。 从 COBOL 到 LISP (实际 上 包 
括 了 在 这 两 种 语言 之 间 的 所 有 语言 )， 都 出 现 了 一 些 支持 面向 对 象 程序 设计 的 方言 。C++ 和 Ada 
95 除 了 文 持 面向 对 象 程序 设计 以 外 ， 还 支持 面向 过 程 ， 以 及 面向 数据 的 程序 设计 。CLOS 是 
LISP 的 面向 对 象 的 版 本 (Bobrow et al., 1988), 也 支持 函数 式 程序 设计 。 一 些 较 新 的 支持 面向 
对 象 程序 设计 的 语言 ， 并 不 支持 其 他 程序 设计 的 范 型 ， 但 仍然 采用 基本 的 命令 式 结 构 ， 并 仍然 
上 共有 命令 式 语言 的 外 观 。 这 样 的 语言 有 Java 和 C#。Ruby 有 氮 不 好 分 类 : 它 是 全 部 数据 都 是 对 象 
的 纯 面向 对 象 语言 ， 但 是 它 也 是 能 用 于 过 程 的 混合 语言 。 最 后 ， 还 有 一 种 纯 面 向 对 象 的 语言 ， 
这 种 语言 极其 地 非 传 统 ， 它 就 是 Smalltalk 语 言 。 Smalltalk 是 第 一 种 全 面 支持 面向 对 象 程序 设计 的 
语言 。 支 持 面向 对 象 程序 设计 的 细节 ， 不 同 的 语言 间 各 有 不 同 ， 而 这 正 是 本 章 的 一 个 重要 课题 。 

本 章 与 第 11 章 十 分 紧密 地 联系 在 一 起 ， 实 际 上 可 以 说 ， 本 章 就 是 第 11 章 的 继续 。 这 种 关系 
充分 反映 了 这 样 的 事实 ， 即 面向 对 象 程序 设计 ， 是 抽象 数据 类 型 的 抽象 原理 的 一 种 应 用 。 尤 其 
征 当 将 面向 对 象 程序 设计 中 一 组 类 似 抽象 数据 类 型 的 共性 抽出 来 ， 形成 一 种 新 的 类 型 时 。 这 组 
类 型 的 成 员 ， 都 继承 了 来 自 这 种 新 类 型 的 共同 部 分 。 这 种 特征 就 是 继承 (inheritance)， 继 承 是 面 
问 对 象 程序 设计 以 及 支持 这 种 设计 的 语言 的 核心 


12.2 面向 对 象 程序 设计 
12.2.1 介绍 


面向 对 象 程序 设计 概念 的 根源 可 以 追溯 到 SIMULA 67; 但 是 这 个 概念 的 全 面 开发 ， 是 直到 
Smalltalk 演 化 促成 了 Smalltalk 80 (当然 是 在 1980 年 ) 的 产生 之 后 才 进 行 的 。 实际 上 ， 有 些 人 认 
为 Smalltalk 是 唯一 的 纯 面向 对 象 程序 设计 语言 。 一 种 面向 对 象 语言 必须 提供 对 于 三 个 关键 的 语 
言 特性 的 支持 ， 这 些 语 言 特性 是 : 抽象 数据 类 型 、 继承 以 及 方法 调用 与 方法 间 的 动态 绑 定 。 我 
们 已 经 在 第 11 章 详细 讨论 过 抽象 数据 类 型 ， 所 以 本 章 的 重点 是 继承 和 动态 绑 定 。 


12.2.2 继承 
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工作 可 能 会 很 困难 ， 因 为 这 要 求 修改 人 员 了 解 部 分 (如果 不 是 全 部 的 话 ) 已 有 的 代码 。 此 外 ， 
在 许多 情况 下 ， 这 种 修改 还 需要 更 新 所 有 的 客户 程序 。 

面向 数据 程序 设计 的 第 二 个 问题 ， 是 所 有 抽象 数据 类 型 的 定义 都 是 独立 的 ， 并 都 在 同一 个 
层次 上 。 这 种 设计 稼 稍 使 得 不 可 能 来 构造 一 个 适合 问题 空间 的 程序 。 在 许多 情况 下 ， 所 隐 含 的 
问题 具有 不 同 的 种 类 但 彼此 相关 的 对 象 ， 有 的 如 同 兄弟 (彼此 相 类 似 )， 也 有 的 如 同 父 子 (具有 
上 下 代 的 关系 )。 

继承 提供 了 一 种 解决 抽象 数据 类 型 的 复 用 所 面临 的 修改 问题 ， 以 及 程序 组 织 问题 的 办 法 。 
如 来 一 种 新 的 抽象 数据 类 型 能 够 继承 一 些 已 有 类 型 的 数据 和 功能 ， 并 且 能 够 允许 修改 一 些 实体 
及 增加 一 些 新 的 实体 ， 那 就 不 需要 改变 被 复 用 的 抽象 数据 类 型 ， 从 而 极 大 地 有 助 于 软件 的 复 用 。 
程序 人 员 可 以 从 已 有 的 抽象 数据 类 型 出 发 ， 设 计 一 个 修改 了 的 后 代 类 型 ， 以 满足 新 问题 的 要 求 。 
继承 还 为 相关 类 的 层次 关系 的 定义 ， 提 供 了 一 个 框架 。 这 种 层次 关系 可 以 反映 出 ， 在 问题 空间 
中 这 些 类 的 上 下 代 关 系 。 

面 器 对 象 语言 中 的 抽象 数据 类 型 ， 采 用 SIMULA 67 中 的 术语 ， 通 常 称 之 为 类 (class) 。 对 应 
于 抽象 数据 类 型 的 实例 ， 即 类 的 实例 ， 被 称 为 对 象 (object) 。 通 过 对 另外 一 个 类 的 继承 来 定义 
的 类 ， 被 称 为 派生 类 (derived class) 或 子 类 (subclass), 。 派 生 新 类 的 类 ， 是 这 个 新 类 的 父 类 
(parent class) 或 超 类 (superclass) 。 将 定义 于 类 的 对 象 上 的 操作 子 程序 ， 称 为 方法 (method ) 。 
而 对 于 方法 的 调用 则 通常 称 为 消息 (message) 。 将 一 个 对 象 的 方法 的 完整 集合 ， 称 为 是 这 个 对 
象 的 消息 协议 (message protocol) 或 者 消息 接口 (message interface) 。 在 一 个 面向 对 象 程序 中 
的 计算 ， 是 通过 从 一 个 对 象 送 往 另 外 一 些 对 象 (在 某 些 情 况 下 是 类 ) 的 消息 来 说 明 的 。 

在 最 简单 的 情况 下 ， 一 个 派生 的 类 继承 其 父 类 的 所 有 实体 (变量 及 方法 ) 。 因 为 在 父 类 实体 
上 的 访问 控制 ， 情 况 就 变 得 十 分 复杂 。 例 如 ， 当 我 们 在 第 11 章 看 到 抽象 数据 类 型 的 定义 时 ， 其 
中 的 一 些 实体 被 设 为 公有 的 ， 而 另外 的 一 些 实体 则 被 设 为 私有 的 。 这 些 访问 控制 允许 程序 的 设 
计 人 员 对 类 的 客户 藏匿 部 分 的 抽象 数据 类 型 。 派 生 类 是 另外 一 种 客户 ， 可 能 会 允许 、 也 可 能 会 
阻止 来 自 这 些 派生 类 的 访问 。 考 虑 到 这 种 可 能 性 ， 从 而 在 一 些 面 向 对 象 语言 中 包括 了 第 三 种 类 
型 的 访问 控制 ， 通 常 称 为 受 保护 的 (protected); 使 用 它 来 允许 来 自 派 生 类 的 访问 ,但 阻止 来 自 
其 他 类 的 访问 。 关 于 是 否 一 个 子 类 包括 了 其 父 类 的 所 有 实体 ， 我 们 将 在 12.3.2 小 节 中 详细 地 讨论 
这 个 问题 。 

除了 从 父 类 继承 实体 外 ， 派 生 类 还 可 以 增加 新 的 实体 ， 以 及 修改 所 继承 的 这 些 方法 。 修 改 
后 的 方法 与 原 有 的 方法 具有 相同 的 名 字 ， 通 常 也 具有 相同 的 协议 。 新 的 方法 被 称 为 覆盖 
(override) 了 继承 的 版 本 ， 因 而 称 这 种 方法 为 覆盖 方法 (overridden method)。 覆 盖 方 法 最 通常 
的 目的 ， 是 为 派生 类 的 对 象 提供 一 种 操作 ， 但 这 种 操作 对 父 类 的 对 象 却 是 不 恰当 的 。 

一 个 类 可 以 具有 两 种 类 型 的 方法 及 两 种 类 型 的 变量 。 最 常用 的 方法 和 变量 ， 被 分 别称 为 实 
例 方 法 (instance method) 和 实例 变量 (instance variable) 类 的 每 一 个 对 象 ， 都 拥有 一 套 自 己 
的 实例 变量 来 存储 对 象 的 状态 。 同 一 个 类 的 两 个 对 象 之 间 的 唯一 不 同 ， 只 是 它们 的 实例 变量 的 
状态 不 同 。 实 例 方 法 只 能 被 够 操作 于 类 的 对 象 之 上 。 类 变量 (Class variable) 属于 类 ， 但 并 不 
属于 类 的 对 象 ， 因 而 一 个 类 只 有 了 唯一 的 一 个 拷贝 。 类 方法 (Class method) 可 以 完成 在 类 上 的 操 
作 ， 也 可 以 完成 这 个 类 的 对 象 上 的 操作 。 

如 采 一 个 新 的 类 是 单个 父 类 的 子 类 , 那么 这 个 派生 的 过 程 就 被 称 单 继承 (single inheritance), 
如 采 一 个 类 具有 多 个 父 类 ， 那 么 这 个 派生 的 过 程 就 被 称 多 继承 (multiple inheritance) 。 当 许多 
类 都 是 通过 单 继 承 相关 联 时 ， 就 能 够 将 这 些 类 的 彼此 关系 显示 在 一 棵 派生 树 中 ， 多 继承 中 类 的 
相互 关系 则 能 够 显示 在 派生 图 之 中 。 


继承 是 作为 增加 复 用 可 能 性 的 一 种 手段 ， 然 而 它 的 缺点 则 是 产生 了 在 继承 层次 结构 中 的 类 
之 间 的 相互 依赖 性 。 这 种 结果 正好 与 抽象 数据 类 型 的 优点 相反 ， 抽 象 数 据 类 型 的 优点 是 数据 类 
型 间 的 相互 独立 性 。 当 然 ， 并 不 是 所 有 的 抽象 数据 类 型 都 必须 是 完全 独立 的 。 但 一 般 而 言 ， 抽 
象 数据 类 型 的 独立 性 是 其 最 具有 效率 的 一 个 正面 特征 。 然 而 ， 要 增加 抽象 数据 类 型 的 复 用 性 ， 
而 不 产生 它们 之 间 的 相互 依赖 性 ， 则 是 非常 困难 的 。 在 很 多 情况 下 ， 类 的 依赖 关系 自然 地 反映 
出 了 问题 空间 中 的 依赖 关系 。 


12.2.3 动态 绑 定 


面向 对 象 程序 设计 语言 的 第 三 个 特征 ， 是 消息 对 于 方法 定义 的 动态 绑 定 所 提供 的 一 种 多 态 
性 。 考 虑 下 面 的 情况 ， 存在 着 一 个 基 类 A，A 中 所 定义 的 一 个 方法 对 于 A 的 对 象 施 行 一 个 操作 。 
将 B 定 义 为 A 的 一 个 子 类 。B 的 对 象 也 需要 一 个 类 似 于 A 中 的 这 个 方法 。 由 于 B 的 对 象 与 A 的 对 象 
略 有 不 同 ， 因 而 B 所 需 的 方法 与 A 的 方法 也 就 不 同 。 因 而 这 个 子 类 将 覆盖 继承 的 方法 。 如 果 一 个 
A 和 B 的 客户 ， 具 有 对 于 A 的 对 象 的 一 个 引用 或 指针 ， 这 个 引用 或 指针 也 将 指向 B 的 对 象 ， 形 成 所 
谓 的 多 态 引 用 (polymorphic reference) 或 多 态 指 针 。 如 果 定 义 于 A 和 B 这 两 个 类 中 的 一 个 方法 是 
通过 多 态 引 用 来 调用 的 ， 运 行 时 系统 在 执行 时 就 必须 决定 ， 究 竟 是 调用 A 中 的 方法 还 是 调用 B 中 
的 方法 。 这 可 以 通过 先 确定 指针 或 引用 当前 所 引用 的 究竟 是 哪 一 个 类 的 对 象 来 决定 。 在 12.5.3 小 
节 中 ， 我 们 将 给 出 一 个 C++ 中 的 动态 绑 定 的 例子 。 

动态 绑 定 的 一 个 目的 ， 就 是 为 了 使 得 软件 系统 的 开发 和 维护 更 加 容易 。 例 如 ， 假 设 一 个 类 
定义 表示 鸟 的 对 象 ， 它 的 子 类 定义 为 特定 的 鸟 类 。 更 进一步 ， 假 设 每 个 子 类 重新 定义 一 个 从 显 
示 它 的 特定 鸟 类 的 基 类 中 继承 的 方法 。 这 些 方法 能 通过 引用 或 指向 鸟 的 基 类 的 指针 来 调用 。 因 
此 ， 如 果 客 户 端 代码 创建 一 个 引用 具体 鸟 类 子 类 对 象 的 基 类 指针 数组 ， 并 且 需 要 显示 数组 中 引 
用 的 每 一 种 鸟 ， 那 么 每 一 种 鸟 的 显示 方法 将 通过 数组 中 的 基 类 指针 调用 相同 的 调用 (在 一 个 循 
环 体内 )。 维 护 这 样 的 好 处 是 添加 新 的 子 类 (对 系统 来 说 是 一 种 新 的 鸟 ) 将 不 需要 改变 调用 显示 
方法 的 代码 。 

在 许多 情况 下 ， 继 承 的 层次 结构 的 设计 将 产生 一 个 或 多 个 类 ， 这 些 类 在 这 种 层次 结构 中 占 
据 了 较 高 的 位 置 ， 以 至 于 这 些 类 的 实例 化 都 不 再 有 意义 。 例 如 ， 假 设 程序 定义 类 builqding 和 
一 组 特定 类 型 的 子 类 ， 如 类 French_Gothic。 如 果 在 类 building 中 具有 被 实现 的 方法 draw， 
或 许 已 经 没有 意义 了 。 但 是 由 于 building 的 所 有 后 代 类 都 应 该 具有 这 种 实现 的 方法 ， 这 种 方 
法 的 协议 (但 不 是 方法 体 ) 就 将 被 包含 在 building 类 中 。 这 种 方法 常常 被 称 为 抽象 方法 
(abstract method) ， 在 C++ 中 也 称 为 纯 虚 拟 方 法 (pure virtual method) 。 此 外 ， 任 何 至 少 包括 了 
一 个 抽象 方法 的 类 都 称 为 抽象 类 (abstract class) ,在 C++ 中 是 称 为 抽象 基 类 (abstract base class), 
这 样 的 类 不 能 够 被 实例 化 ， 因 为 不 是 它 的 所 有 方法 都 具有 方法 体 。 抽 象 类 的 任何 被 实例 化 的 子 
类 ， 都 必须 提供 所 有 继承 的 抽象 方法 的 实现 。 


12.3 面向 对 象 语言 的 设计 问题 

当 设计 用 以 支持 继承 与 动态 绑 定 的 程序 设计 语言 的 特性 时 ， 有 几 个 问题 必须 考虑 ， 我 们 将 
被 认为 是 其 中 最 重要 的 一 些 问 题 ， 在 这 一 节 里 进行 讨论 。 
12.3.1 纯 对 象 模型 


完全 采用 计算 的 对 象 模式 的 语言 的 设计 人 员 设 计 了 一 种 对 象 的 系统 ， 这 种 系统 吸收 了 所 有 
的 其 他 的 类 型 概念 。 在 此 系统 中 的 每 一 件 事 物 ， 从 最 小 的 整数 到 完整 的 软件 系统 都 是 对 象 。 进 
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行 这 种 选择 的 优点 是 语言 的 优雅 性 及 纯粹 一 致 性 ， 以 及 它 的 方便 使 用 。 而 它 的 主要 缺点 是 ， 其 
至 连 简单 操作 都 必须 经 过 消息 传递 的 过 程 来 完成 ， 这 使 得 这 种 方法 常常 会 比 在 命令 式 模型 中 的 
类 似 操 作 要 慢 得 多 ， 而 命令 式 模 型 是 用 机 器 指令 来 实现 简单 操作 的 。 例 如 在 Smalltakk 中 将 数字 7 
加 到 一 个 名 为 x 的 变量 之 上 ， 是 通过 将 对 象 7 作 为 参数 传送 给 对 象 x 的 + 方法 来 实现 的 。 在 最 纯 的 
面向 对 象 的 计算 模型 中 ， 所 有 的 类 型 都 是 类 。 预 定义 的 类 与 用 户 定义 的 类 之 则 不 存在 差别 。 
事实 上 ， 所 有 的 类 都 被 同样 地 对 待 ， 而 且 所 有 的 计算 都 是 经 过 消息 传递 来 完成 的 。 

纯 对 象 模 型 的 一 种 替代 方法 (这 常见 于 增加 了 支持 对 面向 对 象 程序 设计 的 命令 式 语言 中 )， 
是 保持 完全 的 命令 式 类 型 化 模型 ， 而 仅仅 是 再 加 上 对 象 模型 。 这 样 的 结果 即 是 产生 了 一 种 大 型 
的 语言 ， 这 种 语言 的 类 型 结构 ， 将 使 得 除了 个 别 专业 用 户 以 外 的 大 多 数 人 十 分 困惑 。 

纯 对 象 模型 的 另外 一 种 替代 方法 ， 是 使 用 一 种 命令 式 风格 的 类 型 结构 来 作为 原始 标量 类 型 ， 
但 是 实现 所 有 结构 化 类 型 作为 对 象 。 这 种 选择 能 够 提供 在 原始 值 上 的 快速 操作 ， 而 这 种 操作 的 
速度 能 够 与 人 们 在 命令 式 模 型 中 所 期 望 的 速度 相 媲 美 。 但 是 ， 这 种 替代 方法 导致 了 语言 的 复杂 
化 。 在 这 里 不 变 的 是 ， 非 对 象 值 必须 与 对 象 相 混合 ， 从 而 为 非 对 象 类 型 产生 了 对 于 所 谓 的 包装 
类 (wrapper class) 的 需要 ， 这 样 就 可 以 将 一 些 通常 需要 的 操作 发 送 给 包含 非 对 象 值 的 对 象 。 在 
12.6.1 小 市 中 ， 我 们 将 会 在 Java 中 讨论 一 个 这 样 的 例子 。 


12.3.2 子 类 是 子 类 型 吗 


这 里 的 问题 相对 简单 : “is-a (是 一 个 ) 关系 是 否 在 派生 类 与 其 父 类 之 间 成 立 ? 从 纯 语 义 的 
观点 来 看 ， 如 有 果 一 个 派生 的 类 “是 一 个 ” 父 类 ， 那 么 这 个 派生 类 的 对 象 必须 暴露 所 有 由 父 类 对 
象 暴露 的 成 员 。 在 一 种 不 那么 抽象 的 层次 上 ，is-a 关 系 将 保证 一 个 派生 类 类 型 的 变量 ， 可 以 出 现 
在 其 父 类 类 型 的 变量 为 合法 的 任何 位 置 上 ， 而 不 会 导致 任何 类 型 错误 。 而 且 ， 派 生 类 对 象 必须 
在 行为 上 与 父 类 对 象 一 样 。 

Ada 中 的 子 类 型 就 是 这 种 简单 继承 形式 的 例子 。 例 如 ， 


subtype Small Int is Integer range -100..100; 


Small_Int 类 型 的 变量 具有 Integer 变 量 所 拥有 的 所 有 操作 ， 但 是 只 能 够 保存 Integer 
的 所 有 可 能 值 的 一 个 子 集 。 此 外 ， 可 以 将 每 一 个 Small_Int 变 量 用 于 任何 可 以 使 用 Integer 
变量 的 位 置 。 这 就 意味 着 ，Sma11_Int 变 量 在 某 种 程度 上 就 是 Integer 变 量 。 

有 很 多 种 方式 使 子 类 与 其 基 类 或 父 类 不 同 。 例 如 ， 子 类 能 有 更 多 的 方法 ， 能 有 更 少 的 方法 ， 
一 些 参数 的 类 型 在 一 种 或 多 种 方法 中 可 能 是 不 同 的 ， 一 些 方法 的 返回 类 型 可 以 不 同 ， 或 者 一 种 
体 或 多 种 方法 体 也 可 以 是 不 同 的 。 大 多 数 程序 设计 语言 严格 限制 子 类 区 分 基 类 的 方法 。 在 大 多 
数 情形 下 ， 语 言 规则 限制 其 子 类 成 为 其 父 类 的 子 类 型 。 

正如 前 面 讲述 的 ， 如 果 一 个 派生 类 与 其 父 类 具有 is-a 关系 ， 就 称 这 个 派生 类 为 子 类 型 
(subtype) 。 能 够 确保 一 个 子 类 是 子 类 型 的 特征 是 : 而 这 里 的 兼容 指 的 是 ， 这 种 覆盖 方法 可 以 替 
代 被 覆盖 方法 ， 而 不 至 于 引起 类 型 错误 。 那 意味 着 每 种 覆盖 方法 必须 具有 与 被 覆盖 方法 相同 数 
目的 参数 ， 并 且 参 数 类 型 和 返回 类 型 必须 与 父 类 兼容 。 如 果 具 有 同样 的 参数 数目 ， 以 及 同样 的 
参数 类 型 与 返回 类 型 ， 当 然 就 能 够 保证 这 种 兼容 性 。 稍 微 不 严格 的 限制 也 是 可 能 的 ， 这 取决 于 
语言 的 类 型 兼容 性 规则 。 

我 们 的 子 类 型 的 定义 明白 地 说 明了 ， 父 类 中 的 所 有 实体 都 必须 被 继承 到 子 类 之 中 。 因 此 ， 
为 子 类 型 的 派生 过 程 必须 要 求 继承 父 类 的 公有 实体 作为 子 类 的 公有 实体 。 

子 类 型 天 系 和 继承 关系 看 起 来 几乎 完全 是 相同 的 。 然 而 ， 这 种 推测 却 远 非 正 确 。 在 12.5.2 小 
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让 中 ,我 们 将 使 用 一 个 C++ 的 例子 来 解释 这 种 不 正确 的 假设 。 


12.3.3 类 型 检测 与 多 态 


在 12.2 市 中 ， 曾 经 将 面向 对 象 领域 中 的 多 态 定义 为 使 用 一 个 多 态 的 指针 或 一 种 多 态 的 引用 
来 进行 访问 的 方法 ， 这 个 方法 的 名 字 在 类 的 层次 结构 中 被 覆盖 ， 而 正 是 这 种 层次 结构 定义 了 指 
针 或 是 引用 所 指向 的 对 象 。 多 态 的 变量 具有 父 类 的 类 型 ， 并 且 父 类 至 少 定 义 了 被 派生 类 蔬 盖 的 
一 个 方法 的 协议 。 多 态 的 变量 可 以 引用 父 类 及 其 派生 类 的 对 象 ， 因 而 并 不 总 是 能 够 静态 地 确定 
多 态 变量 所 指向 的 对 象 的 类 。 经 过 多 态 变量 所 传送 的 消息 与 方法 的 绑 定 必须 为 动态 的 。 这 里 的 
问题 是 ， 什 么 时 候 对 于 这 种 绑 定 来 施行 类 型 检测 。 

这 个 问题 十 分 重要 ， 因 为 它 与 程序 设计 语言 的 基本 性 质 相关 联 。 因 为 动态 类 型 检查 占用 了 
执行 时 间 和 延缓 了 类 型 错误 检测 ， 所 以 静态 进行 类 型 检测 是 更 好 的 选择 。 要 求 静态 类 型 检查 给 
多 态 消 息 与 方法 间 的 关系 强行 加 上 了 严格 的 限制 。 

一 种 强 类 型 的 语言 在 消息 与 方法 之 间 必 须 进 行 两 种 类 型 检测 ,消息 的 参数 类 型 必须 对 照 广 
法 的 形 参 来 进行 检测 ， 方 法 返回 的 类 型 必须 对 照 消息 所 期 待 的 类 型 进行 检测 。 如 果 这 些 类 型 必 
珊 元 全 匹配 ， 那 么 一 种 覆盖 方法 必须 与 被 覆盖 方法 具有 同样 数目 的 参数 以 及 同样 的 参数 类 型 ， 
并 且 返 回 的 也 是 同样 的 类 型 。 这 条 规则 的 一 种 较 宽 的 规定 可 以 允许 在 实 参 与 形 参 之 间 以 及 返回 
的 类 型 与 消息 所 期 待 的 类 型 之 间 ， 存 在 赋值 兼容 性 。 

午 态 类 型 检测 的 一 种 明显 的 替代 方案 ， 是 推迟 类 型 检测 直到 使 用 多 态 变量 来 调用 一 个 方法 
ZET 


12.3.4 单 继承 与 多 继承 


性 外 一 个 简单 的 问题 是 : 语言 除了 允许 单 继承 外 也 允许 多 继承 中? 然而， 这 个 问题 的 答 实 
也 许 不 是 那么 简单 。 多 继承 的 目的 是 要 允许 一 个 新 的 类 继承 两 个 或 者 多 个 类 ， 

多 继承 有 时 非常 有 用 ， 但 为 什么 语言 设计 者 不 包括 进 多 继承 昵 ?有 两 个 原因 ， 即 复杂 性 与 
效率 。 所 增加 的 复杂 性 可 由 几 个 问题 来 说 明 。 首 先 请 注意 ， 如 果 一 个 类 具有 两 个 互 不 相关 的 父 
类 ， 而 两 者 所 定义 的 名 字 都 没有 在 对 方 之 中 ， 这 当然 没有 问题 。 然 而 ， 假 设 一 个 名 称 为 c 的 子 
类 继承 类 A 与 类 B， 而 且 如 采 类 & 与 类 B 都 包括 了 一 个 名 称 为 display 的 可 继承 方法 如 果 C 需 要 
? 用 display 的 这 两 个 版 本 ， 怎 么 能 够 做 到 ? 当 两 个 父 类 同时 定义 具有 完全 相同 名 称 的 方法 而 
且 这 两 个 万 法 中 的 一 个 或 两 个 必须 在 其 子 类 中 被 覆盖 时 ， 这 种 歧义 性 问题 就 会 变 得 更 加 复杂 

帮 外 的 一 个 问题 是 ， 如 果 A 和 B 都 源 于 共同 的 父 类 z， 而 且 A 和 B 都 是 C 的 父 类 。 我 们 就 称 这 种 
情形 为 菱形 继承 (diamond 或 shard inheritance). 在 这 种 情况 下 ，A 和 B 都 具有 z 的 可 继承 变量 ， 
假设 z 有 一 个 称 为 sum 的 可 继承 变量 ,现在 的 问题 是 ，c 究 竟 是 应 
该 继承 sum 的 这 两 个 版 本 ， 还 是 其 中 的 一 个 。 如 果 是 其 中 之 一 ， 又 
应 该 是 哪 一 个 ? 在 一 些 程序 设计 的 情况 下 ， 仅 仅 需 要 继承 其 中 的 A B 
一 个 ， 而 在 其 他 的 一 些 情况 下 ， 又 需要 二 者 都 被 继承 。 在 12.10 闻 N a 
中 包括 了 实现 这 几 种 情形 的 简略 讨论 。 图 12-1 显 示 了 菱形 继承 。 C 

大 于 效率 方面 的 问题 ， 可 能 更 多 的 是 感觉 上 的 而 非 实际 上 的 。 图 12.1 ARAB 
例如 ， 在 C++ 中 ， 至 少 是 在 一 些 机 器 的 体系 结构 上 ， 支 持 多 继承 
号 只 需要 对 每 一 个 动态 绑 定 方法 的 调用 附加 上 一 种 额外 的 数组 访问 和 操作 (Stroustrup, 1994. 
p270)。 即 使 程序 没有 使 用 多 继承 的 话 ， 也 必须 这 样 做 ， 但 这 仅仅 是 很 小 的 额外 代价 
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多 继承 的 使 用 容易 导致 程序 组 织 的 复杂 化 。 许 多 试图 使 用 多 继承 的 人 都 发 现 ， 设 计 多 继承 
中 的 多 父 类 是 十 分 困难 的 。 维 护 使 用 多 继承 的 系统 可 能 是 一 个 更 为 严重 的 问题 ， 因 为 多 继承 导 
致 了 复杂 的 类 与 类 之 间 的 依赖 关系 。 人 们 仍旧 不 十 分 清楚 的 是 ， 多 继承 所 具有 的 优点 ， 与 在 设 
计 及 维护 中 增加 的 额外 工作 量 相 比 是 否 真正 值得 。 


12.3.5 对 象 的 分 配 与 解除 分 配 


对 象 的 分 配 与 解除 分 配 涉及 两 个 设计 问题 。 第 一 个 问题 ， 是 在 哪里 进行 对 象 的 分 配 。 如 果 
这 些 对 旬 的 行为 类 似 于 抽象 数据 类 型 ， 那 么 也 许 能 够 在 任何 位 置 进行 分 配 。 这 意味 着 它们 可 以 
从 运行 时 的 栈 中 来 分 配 ， 也 可 以 使 用 一 个 操作 符 或 函数 ， 如 new， 将 它们 显 式 地 创建 在 堆 中 。 
如 采 它 们 全 部 都 是 从 堆 上 分 配 ， 则 将 具有 通过 指针 或 引用 变量 来 创建 或 访问 的 统一 方法 的 优越 
性 。 这 种 设计 将 简化 对 于 对 象 的 赋值 操作 ， 使 得 在 任何 情况 下 只 须要 改变 指针 或 引用 的 值 。 也 
可 以 允许 隐 式 间接 地 进行 对 象 的 引用 ， 从 而 简化 访问 的 语法 。 

如 来 对 家 是 栈 动态 的 ， 就 会 有 一 个 与 子 类 型 有 关 的 问题 。 如 果 B 类 是 A 类 的 子 类 ， 并 且 B 是 和 A 
的 子 类 型 ， 那 么 可 以 将 B 类 型 的 一 个 对 象 赋 给 A 类 型 的 一 个 变量 。 例 如 ， 如 果 bl 是 B 类 型 的 变量 ， 
并 且 al 是 A 类 型 的 变量 ， 那 么 ， 

al = bl; 

征 合法 的 语句 。 如 果 al 和 bl1 是 对 于 堆 动态 对 象 的 引用 ， 则 什么 问题 也 没有 一 一 这 仅仅 是 一 
个 简单 的 指针 赋值 。 然 而 如 果 al 和 bl 是 栈 动态 的 ， 那 么 al 和 b1 就 是 值 变量 ， 这 样 就 必须 将 对 
家 的 值 复制 到 目标 对 象 的 空间 中 去 。 如 果 B 给 它 从 A 所 继承 的 部 分 增加 了 一 个 数据 域 ， 那 么 al 在 
栈 中 将 没有 足够 的 空间 来 存放 所 有 的 bl1。 当 赋值 时 ，b1 中 的 多 余数 据 将 被 截 掉 。 这 对 于 书写 和 
使 用 这 段 代 码 的 人 来 说 ， 这 可 能 是 难以 理解 的 。 

第 二 个 问题 涉及 对 象 从 堆 中 分 配 的 情形 。 这 里 的 问题 是 ， 解 除 分 配 到 底 应 该 是 隐 式 的 还 是 
显 式 的 ， 或 是 这 两 者 兼 而 有 之 。 如 果 是 隐 式 地 解除 分 配 ， 就 需要 某 种 隐 式 存储 空间 回收 的 方法 。 
如 采 分 配 可 以 是 显 式 的 ， 就 引起 了 是 否 会 产生 悬挂 指针 或 悬挂 引用 的 问题 。 


12.3.6 动态 绑 定 与 静态 绑 定 


如 我 们 曾经 讨论 过 的 ， 在 继承 的 层次 结构 中 的 消息 对 方法 的 动态 绑 定 ， 是 面向 对 象 程序 设 
计 的 根本 部 分 。 这 里 的 问题 是 ， 是 否 所 有 的 消息 与 方法 间 的 绑 定 都 是 动态 的 。 一 种 替代 的 方案 ， 
征 多 许 用 户 来 说 明 哪 种 绑 定 应 该 为 动态 的 ， 哪 种 又 应 该 为 静态 的 。 静 态 绑 定 的 好 处 ， 是 比 动态 
绑 定 的 速度 更 快 。 所 以 如 果 并 不 需要 动态 绑 定 的 话 ， 我 们 就 没有 必要 一 定 要 付出 高 的 代价 。 


12.3.7 REŽ 


进行 幅 套 类 定义 的 一 个 主要 原因 是 信息 隐藏 。 如 果 仅 有 一 个 类 需要 一 个 新 类 ， 那 么 没有 理 
由 定义 一 个 能 被 其 他 类 看 见 的 新 类 。 在 这 种 情况 下 ， 这 个 新 类 可 以 舱 套 在 使 用 它 的 类 中 。 在 某 
些 情 次 下 ， 新 类 可 以 舱 套 在 子 程序 中 ， 而 不 是 直接 虑 套 在 另 一 个 类 中 。 

在 其 中 艇 套 了 新 类 的 类 叫 作 稚 套 类 。 与 类 艇 套 有 关 的 最 明显 的 设计 问题 与 可 见 性 有 关 。 一 
个 主要 问题 是 : 艇 套 类 中 的 哪些 内 容 对 被 戏 套 类 是 可 见 的 ? 另 一 个 主要 问题 正好 与 此 相反 ， 茂 
KEK IBLE Al Ze at He BE a BT LA 


12.4 Smalltalk 对 面向 对 象 程序 设计 的 支持 
很 多 人 认为 Smalltalk 是 权威 的 面向 对 象 程序 设计 的 语言 。 它 是 第 一 种 包括 了 对 于 面向 对 象 
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程序 设计 全 面 支持 的 语言 。 因 而 很 自然 地 ， 我 们 将 从 Smalltalk 开 始 ， 来 描述 支持 面向 对 象 程序 
设计 的 语言 。 


12.4.1 一 般 特 征 


Smalltakk 的 程序 完全 由 对 象 组 成 ， 因 而 无 物 不 是 对 象 。 事 实 上 每 一 个 事物 ， 从 简单 的 ， 如 
整数 常量 2， 到 复杂 的 文件 处 理 系统 ， 都 是 对 象 。 对 象 被 等 同 地 对 待 。 它 们 都 具有 局 部 存储 能 
内 在 处 理 能 力 、 与 其 他 对 象 通 信 的 能 力 以 及 从 祖先 那里 继承 方法 与 实例 变量 的 可 能 性 。 

消 妃 可 以 使 用 引用 对 象 的 变量 来 作为 参数 。 对 于 消息 的 回复 具有 对 象 的 形式 ， 并 且 被 用 来 
返回 被 请 求 的 信息 或 者 是 确定 被 请 求 的 服务 已 完成 。 

Smalltalk 中 的 所 有 对 象 都 从 堆 中 分 配 ， 并 且 通 过 引用 变量 来 引用 一 一 这 是 一 种 隐 式 间接 的 
引用 。 不 存在 显 式 解 除 分 配 的 语句 或 操作 ， 所 有 的 解除 分 配 都 是 隐 式 的 ， 并 且 使 用 废料 收集 程 
序 来 进行 存储 空间 的 回收 。 

不 同 于 C++ 和 Ada 95 之 类 的 混合 式 语言 ，Smalltalk 只 是 为 单一 的 软件 开发 技术 一 一 即 面向 对 
家 的 方法 而 设计 的 。 此 外 ，Smalltalk 没 有 采用 任何 命令 式 语言 的 外 表 。 这 种 语言 的 目的 之 纯粹 ， 
反映 在 语言 的 简单 优雅 以 及 语言 设计 的 一 致 性 上 。 


12.4.2 类 型 检测 与 多 态 


在 Smalltalk 中 ， 是 通过 这 样 的 操作 来 施行 消息 与 方法 的 动态 绑 定 的 ， 送 往 一 个 对 象 的 消息 ， 
将 引起 这 个 对 象 所 属 的 类 来 搜索 对 应 的 方法 。 如 果 没 有 找到 的 话 ， 搜 索 将 继续 在 这 个 类 的 超 类 
之 中 进行 ， 并 依 此 类 推 ， 一 直 进 行 到 不 具有 超 类 的 系统 类 Object 为 止 。0bject 是 类 的 派生 树 
的 根 ， 而 在 这 个 派生 树 中 的 每 一 个 类 都 是 一 个 节点 。 如 果 在 这 条 链 中 没有 发 现任 何方 法 ， 则 会 
产生 一 个 错误 。 重 要 的 是 必须 记 住 ， 这 些 方法 的 搜索 是 动态 的 ， 并 且 发 生 于 发 送 消息 之 时 。 在 
任何 情况 下 Smalltalk 中 的 消息 都 不 会 与 方法 静态 地 绑 定 。 

Smalltakk 中 唯一 的 类 型 检测 也 是 动态 的 ， 并 且 在 检测 中 仅 有 的 类 型 错误 ， 发 生 在 发 送 消息 
给 一 个 没有 被 匹配 的 方法 的 对 象 之 时 ， 而 无 论 这 个 方法 是 局 部 的 还 是 继承 的 。 这 个 概念 与 其 他 
大 多 数 语言 中 的 类 型 检测 不 同 。Smalltalk 中 的 类 型 检测 具有 确保 消息 与 某 个 方法 相 匹 配 的 简单 
目的 。 

Smalltalk 中 的 变量 是 无 类 型 的 ， 任 何 名 字 都 能 够 被 绑 定 到 任何 对 象 之 上 。 这 样 做 的 直接 结 
朱 征 Smalltalk 支 持 动态 的 多 态 。 只 要 变量 的 类 型 是 一 致 的 ， 究 竟 是 什么 类 型 都 是 无 所 谓 的 ， 从 
面 Smalltalk 的 代码 都 是 通用 的 。 变 量 上 的 操作 (方法 或 操作 符 ) 的 含义 由 变量 当前 所 绑 定 的 类 
来 决定 。 

这 种 讨论 的 要 点 是 ， 只 要 在 一 个 表达 式 中 所 引用 的 对 象 具 有 这 个 表达 式 的 消息 的 方法 ， 对 
家 的 类 型 就 是 无 所 谓 的 。 这 意味 着 这 些 代 码 都 与 特定 的 类 型 无 关 。 


12.4.3 继承 


一 个 Smalltalk 的 子 类 将 从 它 的 超 类 继承 所 有 的 实例 变量 、 实 例 方法 和 类 方法 。 子 类 也 可 以 
拥有 有 自己 的 实例 变量 ,， 但 必须 具有 与 祖先 类 中 的 变量 不 同 的 变量 名 。 最 后 一 点 ， 子 类 可 以 定义 
新 的 方法 ， 也 可 以 重新 定义 已 经 存在 于 祖先 类 中 的 方法 。 如 果子 类 具有 一 个 方法 ， 这 个 方法 的 
名 称 及 协议 与 一 个 祖先 类 的 相同 ， 那 么 这 个 子 类 方法 就 将 祖先 类 的 方法 隐藏 起 来 。 对 于 这 个 被 
隐藏 的 方法 的 访问 ， 是 通过 具有 伪 变 量 super 前 组 的 消息 来 提供 。 这 个 前 缀 使 得 方法 的 搜索 是 
从 超 类 开始 ， 而 不 是 从 局 部 开始 。 
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因为 在 父 类 中 的 实体 不 能 够 对 于 子 类 隐藏 起 来 ， 因 而 所 有 子 类 都 是 子 类 型 。 每 个 子 类 对 象 
和 其 父 类 对 象 之 间 保 持 着 is-a 关 系 。 
Smalltalk 支 持 单 继承 ， 但 不 允许 多 继承 。 


12.4.4 Smalltalk 的 评估 


虽然 Smalltalk 的 系统 很 大 ， 但 它 仍旧 是 一 种 小 型 语言 。 这 种 语言 的 语法 也 非常 简单 与 规则 。 
它 本 身 就 是 一 个 极 好 的 例子 ， 说 明 如 果 一 种 语言 是 围绕 一 个 简单 而 有 效 的 概念 来 建造 的 ， 一 种 
小 型 语言 就 能 够 提供 强大 的 功能 。 在 Smalltalk 的 情形 中 ， 这 种 语言 的 概念 是 ， 所 有 的 程序 设计 
都 能 通过 使 用 继承 、 对 象 和 消息 传递 所 建造 类 的 层次 结构 来 完成 。 

比较 传统 编译 的 命令 式 语言 的 程序 ， 等 同 Smalltalk 的 程序 要 慢 得 多 。 虽 然 从 理论 的 角度 
来 省 视 ， 能 够 在 消息 传递 的 模型 中 提供 数组 的 索引 以 及 循环 是 十 分 有 趣 的 ， 然 而 效率 是 评估 
程序 设计 语言 的 重要 因素 。 因 此 在 大 部 分 讨论 中 ， 效 率 显然 是 Smalltalk 在 实际 应 用 中 的 一 个 
问题 。 

Smalltakk 的 动态 绑 定 允 许 直 到 运行 时 才 检查 类 型 错误 。 可 以 编写 并 且 编 译 一 个 程序 ， 这 个 
程序 中 的 消息 被 发 送 给 一 个 并 不 存在 的 方法 。 较 之 一 种 静态 类 型 的 语言 ， 这 将 引起 比 后 面 开发 
中 的 多 得 多 的 错误 修正 。 

总 而 言 之 ，Smalltalk 的 设计 自始至终 都 偏重 于 语言 的 优雅 性 ， 以 及 严格 遵从 面向 对 象 的 程 
序 设计 ， 而 常常 并 不 从 实际 的 角度 来 考虑 问题 , 尤其 是 在 执行 效率 方面 。 最 为 明显 的 是 在 非 对 象 
不 使 用 以 及 无 类 型 变量 等 方面 。 

Smalltalk 的 用 户 界面 对 于 计算 有 着 重要 的 影响 :视窗 的 整合 使 用 、 鼠 标 指向 机 制 ， 以 及 弹 
出 式 或 下 拉 式 菜单 ， 都 是 首先 出 现 于 Smalltalk 中 ， 主 宰 了 当代 的 软件 系统 。 

Smalltalk 语 言 最 重大 的 影响 是 先进 的 面向 对 象 的 程序 设计 ， 这 已 经 成 为 了 最 广泛 使 用 的 程 
序 设计 以 及 编码 方法 学 。 


12.5 C++ 对 面 品 对 象 程序 设计 的 支持 


我 们 在 第 2 章 里 曾经 描述 了 C++ 是 怎样 从 C 和 SIMULA 67 中 演变 而 来 的 ，C++ 的 设计 目的 ， 
是 支持 面向 对 象 程序 设计 。 我 们 也 曾经 在 第 11 章 中 讨论 过 ，C++ 中 的 类 对 于 抽象 数据 类 型 的 支 
持 。 在 这 一 节 里 我 们 将 要 研究 的 是 C++ 对 于 面向 对 象 程序 设计 的 一 些 其 他 基本 要 素 的 支持 ， 
C++ 中 的 类 、 继 承 和 动态 绑 定 的 整个 细节 十 分 庞大 与 复杂 。 本 节 仅 仅 讨论 这 些 题目 中 最 为 重要 
的 一 些 问题 ， 特 别 是 那些 与 曾经 在 12.3 节 中 讨论 过 的 设计 问题 直接 相关 的 问题 ， 

C++ 仍然 是 最 广泛 使 用 的 、 最 流行 的 面向 对 象 程序 设计 语言 。 因 而 自然 成 为 了 其 他 语言 相 比 
较 的 对 象 。 由 于 以 上 两 个 原因 ， 我 们 对 于 C++ 的 介绍 比 在 这 一 小 节 中 包括 的 其 他 语言 更 为 详细 ， 


12.5.1 一 般 特 征 


C++ 的 一 个 主要 设计 考虑 是 与 C 语 言 向 后 兼容 ， 因 而 C++ 保 留 了 C 语 言 的 类 型 系统 ， 并 且 还 
加 进 了 类 。 因 此 ，C++ 既 有 传统 命令 式 语 言 的 类 型 ， 又 有 面向 对 象 语言 的 类 结构 。 它 既 支 持 方 
法 ， 又 支持 不 从 属于 任何 类 的 函数 。 这 使 得 C++ 成 为 了 一 种 混合 式 语 言 ， 它 既 支持 过 程式 程序 
设计 ， 也 支持 面向 对 象 程 序 设计 。 

C++ 的 对 象 可 以 是 静态 的 、 栈 动态 的 和 堆 动态 的 。 因 为 Ct+ 没 有 隐 式 存储 空间 的 回收 , 需要 
使 用 delete 操 作 符 对 于 堆 动态 的 对 象 显 式 地 解除 分 配 。 
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C++ 中 的 所 有 的 类 至 少 包 括 了 一 个 构造 器 方法 ， 用 于 设 定 新 对 象 的 数据 成 员 的 初 值 。 当 产 
生 一 个 对 象 时 ， 构 造 器 方法 就 被 隐 式 地 调用 。 如 果 任 何 一 个 数据 成 员 是 指向 堆 分 配 的 数据 的 指 
针 ， 则 由 构造 器 来 进行 这 种 分 配 。 如 果 在 类 的 定义 中 没有 包含 构造 器 ， 编 译 器 就 将 提供 一 个 简 
音 的 构造 器 。 这 个 默认 的 构造 器 将 调用 父 类 的 构造 器 ， 如 果 存 在 着 父 类 的 话 (参见 12.5.2 节 ) 

许多 类 的 定义 包括 一 个 析 构 器 方法 ， 当 类 的 一 个 对 象 停止 存在 时 析 构 器 方法 被 隐 式 地 调用 。 
入 构 器 被 用 来 删除 数据 成 员 引 用 的 堆 分 配 的 内 存 。 通 常 为 了 调试 的 目的 ， 也 可 以 使 用 析 构 器 方 
法 来 记录 这 个 对 象 停止 之 前 部 分 的 或 全 部 的 状态 。 


12.5.2 继承 


一 个 C++ 的 类 可 以 派生 于 一 个 已 有 的 类 ， 这 个 已 有 的 类 就 成 为 这 个 C++ 类 的 父 类 或 基 类 ， 
与 Smalltalk 不 同 的 是 ，C++ 中 的 一 个 类 可 以 是 独立 的 ， 它 不 具有 超 类 。 
定义 于 一 个 类 的 定义 中 的 数据 ， 被 称 为 这 个 类 的 数据 成 员 ， 而 定义 于 一 个 类 的 定义 中 的 函 
数 ， 则 被 称 为 这 个 类 的 成 员 函 数 (在 其 他 语言 中 的 成 员 函 数 通 常 称 为 方法 )， 基 类 的 部 分 或 全 部 
的 数据 成 员 以 及 成 员 函 数 ， 都 可 能 是 被 派生 类 所 继承 的 ， 它 们 也 能 够 增加 新 的 数据 成 员 和 成 员 
函数 ， 并 且 能 够 修改 继承 而 来 的 成 员 。 
企 第 11 章 里 曾经 讨论 过 ， 类 的 成 员 可 以 是 私有 的 、 受 保护 的 或 者 是 公有 的 。 私 有 的 成 员 只 
能 够 接受 成 员 函 数 以 及 这 个 类 的 友 元 的 访问 。 函 数 和 类 都 可 以 被 声明 为 一 个 类 的 友 元 ， 并 因此 
被 证 可 对 于 这 个 类 的 私有 成 员 进行 访问 。 任 何 函数 都 可 以 访问 公有 的 成 员 。 除 了 对 派生 类 以 外 ， 
受 你 护 的 成 员 像 私 有 成 员 一 样 ， 对 于 这 类 成 员 的 访问 将 在 下 面 给 予 描述 。 派 生 类 可 以 修改 它们 
所 继承 的 成 员 的 可 访问 性 。 派 生 类 的 语法 形式 为 
class 派生 类 名 称 : 访问 模式 基 类 名 称 
{数据 成 员 和 成 员 函 数 的 声明 }; 
访问 模式 ”可 以 是 public 或 private (不 要 混淆 带 有 公有 成 员 和 私有 成 员 的 公有 派生 和 
惟有 派生 )。“ 在 公有 的 派生 类 中 ， 基 类 的 公有 的 成 员 与 受 保护 的 成 员 ， 也 分 别 是 公有 的 和 受 保 
扩 的 成 员 。 在 私有 的 派生 类 中 ， 基 类 的 公有 的 成 员 与 受 保护 的 成 员 都 是 私有 的 。 因 此 在 类 的 层 
次 等 多 中 ， 一 个 私有 的 派生 类 切断 了 所 有 后 续 类 对 于 任何 祖先 类 的 成 员 的 访问 ， 受 保护 的 成 员 
或 许可 以 也 或 许 不 可 以 接受 后 续 子 类 的 访问 。 一 个 基 类 的 私有 成 员 是 被 派生 类 所 继承 的 ， 但 它 
们 对 于 这 个 派生 类 的 成 员 是 不 可 见 的 ， 因 此 在 那里 就 没有 用 处 。 考 虑 下 面 的 例子 ， 
class base class { 
private: 
int a; 
float x; 
protected: 
int b; 
float y; 
public: 
int c; 
float z; 
}; 


class subclass 1 : public base class { ... }3 
class subclass 2 : private base class t aan. pi 


O 它 也 可 以 是 protected,， 但 这 里 不 讨论 那个 选项 。 
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在 subclass 1 中 ，b 和 Y 为 受 保护 的 ， 而 c 和 z 为 公有 的 。 在 subclass 2, b, y, cfil 
z 是 私有 的 。subclass 2 的 派生 类 的 成 员 不 能 够 访问 base_class 中 的 任何 成 员 。 
Base class 中 的 数据 成 员 a 和 x 在 subclass_1 或 subclass_2 中 都 是 不 能 够 访问 的 。 

注意 ， 私 有 派生 子 类 不 能 为 子 类 型 。 例 如 ， 如 果 基 类 有 一 个 公有 数据 成 员 ， 那 么 在 私有 派 
生 下 ， 数 据 成 员 在 子 类 中 将 是 私有 的 。 然 而 ， 如 果 用 子 类 对 象 替 代 基 类 对 象 ， 对 子 类 对 象 数据 
成 员 的 访问 将 是 不 合法 的 。 这 将 破坏 is-a 关 系 。 

父 类 的 成 员 对 于 私有 派生 类 的 实例 都 不 是 隐 式 可 见 的 。 如 果 任 何 成 员 要 成 为 可 见 的 ， 就 必 
须 从 派生 类 里 重新 输出 。 虽 然 这 个 派生 是 私有 的 ， 这 种 重新 输出 事实 上 避免 了 成 员 的 藏匿 。 例 
如 ， 考 虑 下 面 的 类 定义 : 


class subclass 3 : private base class { 
base class :: C}; 


} 


现在 ，subclass_3 的 实例 就 能 够 访问 c。 对 于 c 而 言 ， 这 个 派生 好 像 已 经 成 为 了 公有 的 一 样 。 
在 这 个 类 定义 中 的 双 冒 号 (::) 是 一 个 作用 域 归结 操作 符 。 它 说 明定 义 后面 所 跟随 的 实体 的 类 。 

下 面 段落 的 例子 说 明 私有 派生 的 目的 和 使 用 。 

考虑 下 面 C++ 继 承 的 例子 ， 在 此 例 中 定义 了 一 个 普通 的 链表 类 ， 然 后 又 使 用 这 个 类 来 定义 
两 个 有 用 的 子 类 : 


class single linked list { 
private: 
class node { 
public: 
node *link; 
int contents; 
}; 
node *head; 
public: 
single linked_list() {head = 0}; 
void insert _at_head(int); 
void insert at _tail(int); 
int remove at_head(); 
int empty(); 
}; 
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类 node 是 位 于 private 子 句 中 ， 这 使 得 node 对 于 其 他 的 类 为 不 可 见 的 。 然 而 ，node 的 成 员 
们 又 是 公有 的 ， 这 使 得 这 些 成 员 对 于 岁 套 node 的 single_linked_1list 类 是 可 见 的 。 如 果 
这 些 成 员 是 私有 的 ，node 则 会 需要 将 租 套 它 的 single linked 1ist 类 声明 成 为 一 个 
friend， 以 使 得 这 些 成 员 在 single_linked_1list 中 为 可 见 的 。 请 注意 ， 被 幢 套 的 类 对 于 赂 
套 它 们 的 类 的 成 员 并 没有 特殊 的 访问 权力 。 对 被 仍 套 的 类 在 骨 套 它们 的 类 中 只 有 static 的 成 
five Ay LAY. © 

候 套 类 single_linked_1ist 只 有 一 个 数据 成 员 一 一 即 作 为 这 个 表 的 首部 的 一 个 指针 。 
single_linked_1list 还 包含 了 一 个 构造 函数 ， 这 个 函数 只 是 将 head 设 置 为 空 指针 值 。 四 个 


O 也 可 以 将 一 个 类 定义 在 另 一 个 类 的 方法 之 中 。 这 种 类 的 作用 域 规则 与 直接 定义 在 其 他 类 中 的 类 的 作用 域 规则 
相同 ， 甚 至 也 与 在 这 个 方法 中 所 声明 的 局 部 变量 的 作用 域 规则 相同 。 
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成 员 函 数 允 许 将 节点 插入 到 链表 对 象 的 任意 一 端 ， 并 允许 将 节点 从 链表 的 一 端 删除 ， 以 及 允许 
测试 链表 为 空 。 
下 面 的 定义 提供 了 栈 及 队 的 类 ， 它 们 都 基于 single linked list, 


class stack : public single linked list { 
public: 
stack() {} 
void push(int value) { 
single linked list :: insert_at_head( value); 
} 
int pop() { 
return single linked list :: remove at head(); 
} 
}; 
class queue : public single linked list { 
public: 


queue() {} 
void enqueue(int value) { 
Single linked list :: insert at tail(value); 
} 
int dequeue() { 
single linked list :: remove at _head(); 
} 

}; | 

注意 ， stack 和 queue 子 类 的 对 象 都 可 以 访问 定义 于 基 类 single_1linked list (因为 
它 是 一 个 公有 的 派生 ) 中 的 empty 函 数 。 这 两 个 子 类 都 定义 了 不 做 任何 事情 的 构造 函数 。 当 
创建 子 类 的 一 个 对 象 时 ， 将 隐 式 地 调用 这 个 子 类 中 适用 的 构造 器 。 然后 再 调用 基 类 中 的 任何 
运用 的 构造 器 。 因 而 在 我 们 的 例子 中 ， 当 创建 一 个 stack 类 型 的 对 象 时 ， 将 调用 不 从 事 任何 
事情 的 stack 的 构造 器 。 然 后 再 调用 single_1inkeqd 1ist 中 的 构造 器 ， 用 以 进行 必要 的 
初始 化 工作 。 

类 stack 与 类 queue 一 样 都 存在 着 相同 的 严重 问题 ， 这 两 者 的 对 象 都 能 访问 父 类 sing1- 
e_linked_1list 的 所 有 公有 的 成 员 。 因 而 ， 一 个 stack 对 象 可 以 访问 insert at tail, 
并 因此 来 破坏 它 的 栈 完整 性 。 同 样 地 ， 一 人 queue 对 象 也 可 以 访问 insert_at_head。 之 所 
以 允许 这 些 不 必要 的 访问 ， 是 因为 stack 和 queue 都 是 single_linked_1list 的 子 类 型 。 
公有 派生 使 用 在 子 类 继承 基 类 的 全 部 接口 。 可 以 替换 的 方式 是 在 子 类 只 继承 基 类 的 实现 时 介 
主 派 生 。 可 以 使 用 private 的 派生 而 不 是 用 public 的 派生 来 编写 这 两 个 派生 类 ， 从 而 使 得 它 
们 不 再 是 其 父 类 的 子 类 型 。 这样， 这 两 者 也 都 会 需要 重新 输出 empty， 因为 empty 将 会 对 于 
这 两 个 派生 类 的 实例 隐藏 起 来 。 这 种 情况 说 明 需 要 私有 派生 。 我 们 将 分 别 命名 为 stack_ 2 与 
queue_2 的 栈 与 队 类 型 的 新 的 定义 显示 如 下 : 

class stack 2 : private single linked list { 

public: 
Stack 2() {} 
void push(int value) { 
Single linked list :: insert_at_head( value); 
} 
int pop() { 
5 因为 父 类 的 公有 成 员 能 在 客户 端 中 看 到 ， 所 以 它们 将 不 是 子 类 型 (不 在 子 类 的 客户 端 中 ， 它 们 的 成 员 是 私 
有 的 )。 
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return single linked_list :: remove _at_head(); 


} 
single linked list:: empty; 


}; 
class queue 2 : private single linked list { 
public: 
queue 2() {} 
void enqueue(int value) { 
single linked list :: insert_at_tail(value); 
} 
int dequeue() { 
single linked list :: remove _at_head(); 

} 

Single linked list:: empty; 
}; 
这 两 种 栈 和 队 的 版 本 说 明了 子 类 型 与 非 子 类 型 的 派生 类 型 之 间 的 差别 。 由 于 可 以 将 栈 和 队 
实现 为 链表 , 链表 就 是 这 两 者 的 一 般 化 形式 。 因 此 很 自然 地 ， 我 们 可 以 通过 继承 一 个 链表 类 来 定 
义 栈 和 队 的 类 。 然而 , 栈 和 队 的 类 都 不 是 链表 类 的 子 类 型 。 但 反 过 来 , 链表 类 却 是 栈 和 队 类 的 子 
类 型 。 

为 什么 需要 友 元 ， 其 中 的 一 个 理由 是 有 时 必须 编写 这 样 的 子 程序 ， 它 能 够 访问 两 个 不 同 的 
类 的 成 员 。 例 如 ， 假 设 一 个 程序 使 用 一 个 类 作为 向 量 ， 而 使 用 另外 的 一 个 类 作为 矩阵 ， 并 且 需 
要 一 个 子 程序 来 将 这 两 个 类 的 对 象 相 乘 。 在 C++ 中 ， 是 将 这 个 乘法 函数 定义 为 这 两 个 类 的 友 元 .， 
就 可 以 进行 所 需 运 算 。 

C++ 通 过 允许 命名 多 个 类 作为 一 个 新 类 的 父 类 ， 从 而 提供 了 多 继承 的 选择 。 例 如 ， 


class A { ... }; 
class B { ... }; 
class C : public A, public B 4 wan Fi 


类 C 继 承 类 A 与 类 B 的 所 有 成 员 。 如 果 A 和 B 碰 巧 都 包括 了 具有 相同 名 字 的 成 员 ， 通 过 使 用 作 
用 域 归结 操作 符 ， 这 些 成 员 就 能 够 被 类 c 的 对 象 毫 无 歧义 地 引用 。 在 第 12.10 节 中 我 们 将 讨论 在 
C++ 中 实现 多 继承 的 一 些 问 题 。 

C++ 中 的 覆盖 方法 必须 具有 与 被 覆盖 方法 完全 一 致 的 参数 形式 。 如 果 在 这 种 参数 形式 中 存 
在 者 任何 不 同 ， 那 么 在 子 类 中 的 这 个 方法 就 会 被 认为 是 一 个 新 的 方法 ， 与 在 祖先 类 中 的 具有 相 
同名 字 的 方法 无 关 。 和 覆盖 方法 的 返回 类 型 必须 与 被 覆盖 方法 的 一 致 ， 或 者 必须 是 被 覆盖 方法 瓜 
回 类 型 的 公有 派生 类 型 。 


12.5.3 JERE 


到 目前 为 此 ， 我 们 所 定义 的 所 有 成 员 函 数 都 是 静态 绑 定 的 ， 也 就 是 说 ， 将 每 一 个 成 员 函 数 
的 调用 都 静态 地 绑 定 于 一 个 函数 定义 。 可 以 通过 一 个 值 变量 来 操纵 一 个 C++ 中 的 对 象 ， 而 不 是 
通过 一 个 指针 或 通过 一 个 引用 (这 样 的 对 象 就 是 栈 动态 的 ) 。 在 这 种 情况 下 ， 对 象 的 类 型 是 已 知 
的 静态 的 ， 所 以 就 不 需要 动态 的 绑 定 。 另 外 的 一 个 方面 ， 我 们 能 够 使 用 一 个 指针 或 是 一 个 具有 
基 类 类 型 的 引用 变量 ， 来 指向 任何 由 基 类 派生 的 类 的 对 象 ， 使 得 它 成 为 一 个 多 态 变 量 。 私 有 派 
生子 类 不 是 子 类 型 。 指 向 基 类 的 指针 不 能 用 来 引用 在 不 是 子 类 型 的 子 类 中 的 方法 

C++ 不 允许 值 变量 ( 非 指针 或 引用 ) 为 多 态 的 。 当 使 用 这 种 多 态 变 量 来 调用 一 个 定义 于 派 
生 类 中 的 函数 时 ， 必 须 将 这 个 调用 动态 地 绑 定 于 正确 的 函数 定义 之 上 。 对 于 需要 动态 绑 定 的 成 
员 函 数 ， 必 须 将 保留 字 virtual 放 置 于 这 些 函 数 的 首部 之 前 ,来 将 这 些 成 员 函 数 声明 为 虚拟 所 
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数 ， 而 这 种 声明 只 能 够 出 现 于 类 体 中 。 
考虑 有 一 个 名 为 shape 的 基 类 以 及 一 组 用 于 各 种 形状 (AUG, FE) 的 派生 类 的 情形 。 
如 果 需 要 显示 这 些 形状 ， 则 对 于 每 一 个 子 类 或 者 是 对 于 每 一 种 形状 ， 显 示 成 员 函 数 draw 都 必 
须 是 唯一 的 。draw 的 这 些 版 本 都 必须 被 定义 为 虚拟 函数 。 当 使 用 一 个 指向 这 些 派生 类 的 基 类 的 
旨 针 来 调用 draw 时 ， 必 须 将 这 个 调用 动态 地 绑 定 于 正确 派生 类 的 成 员 函 数 上 。 下 面 给 出 刚才 描 [526] 
述 过 的 例子 中 的 定义 ; 
public class shape { 


public: 
virtual void draw() = 0; 


} 
public class circle : public shape { 
public: 
void draw() { ... } 


} 
public class rectangle : public shape { 
public: 
void draw() { ... } 


} 
public class square : public rectangle { 
public: 
void draw() { ... } 


} 
在 给 出 了 这 些 定义 之 后 ， 就 有 下 面 的 静态 绑 定 与 动态 绑 定 两 类 调用 的 例子 ; 


Square* sq = new square; 
rectangle* rect = new rectangle; 
shape* ptr_ shape; 


ptr_shape = sq; // 现在 ptr_shape 指 向 square 对 象 
ptr_shape->draw(); // 动态 绑 定 到 square 类 中 的 daraw 方 法 
rect->draw( ) ; // 静态 绑 定 到 rectangle 类 中 的 dravw 方 法 527 


注意 ， 将 上 面 基 类 shape 的 定义 中 的 draw 函 数 设置 为 零 。 使 用 这 一 特定 语法 来 指示 其 成 员 
国 数 是 一 个 纯 虚 拟 函 数 (pure virtual function) ， 这 就 意味 着 这 种 函数 没有 函数 体 ， 并 且 不 能 够 
锌 调用 。 如 有 果 它 们 调用 函数 ， 那 么 这 种 函数 必须 被 重新 定义 于 派生 类 之 中 。 纯 虚拟 函数 的 目的 
征 提 供 国 数 的 接口 ， 但 并 不 给 出 函数 的 任何 实现 。 当 基 类 中 一 般 成 员 函 数 将 不 使 用 时 ， 通 常 定 
义 纯 虚拟 国 数 。 第 12.2.3 节 将 讨论 这 种 情形 。 

任何 包括 了 纯 虚 拟 函数 的 类 ， 都 是 一 种 抽象 类 (abstract class)。 实 例 在 抽象 类 是 不 合法 的 。 
在 严格 意义 上 ， 抽 象 类 只 用 于 表示 类 型 特征 。C++ 提 供 抽 象 类 来 模拟 这 些 真正 的 抽象 类 型 。 如 
末 一 个 抽象 类 的 子 类 没有 被 重新 定义 为 其 父 类 的 一 个 纯 虚 拟 函 数 ， 这 个 函数 仍旧 是 子 类 中 的 纯 
虚拟 函数 ， 而 且 子 类 也 是 抽象 类 。 

抽象 类 与 继承 ,成 为 支持 软件 开发 的 强 有 力 的 技术 。 这 些 技 术 人 允许 按 层次 来 定义 类 型 ， 以 
便 相关 的 类 型 可 以 是 定义 其 共同 抽象 特征 的 抽象 类 型 的 子 类 ， 

动态 绑 定 ， 允 许 在 任何 araw 的 版 本 被 编写 之 前 就 编写 调用 daraw 的 代码 ， 其 至 是 任何 draw 
的 版 本 被 编写 之 前 。 新 的 派生 类 可 以 在 几 年 之 后 再 附加 进来 ， 而 不 需要 对 使 用 这 种 动态 绑 定 成 
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员 的 代码 做 出 任何 改动 。 这 正 是 面向 对 象 语言 的 一 种 非常 有 用 的 特性 。 
栈 动 态 对 象 的 引用 赋值 与 堆 动态 对 象 的 指针 赋值 不 同 。 例 如 ， 考 虑 下 面 的 代码 ， 它 使 用 了 
与 上 例 中 相同 的 类 层次 : 


square sq; // 在 栈 上 分 配 square 对 象 
rectangle rect; / /在 栈 上 分 配 Yrectangle 对 象 
rect = sq; // 从 square 对 象 复 制 数 据 成 员 值 
rect.draw(); // 从 rectangle 对 象 调用 draw 方 法 


在 赋值 语句 rect=sdq 中 ， 虽 然 sg 引用 对 象 的 成 员 数据 将 被 赋值 给 rect 引用 对 象 的 数据 成 
员 ,， 但 是 rect 仍 将 引用 rectangle 对 象 。 因 此 ,通过 rect3 引 用 对 象 调用 draw 将 是 
rectangle 类 。 如 果 rect 和 sq 是 指向 堆 动态 对 象 的 指针 ， 那 么 同样 的 赋值 将 是 指针 赋值 ， 它 
使 rect 指 辣 square 对 象 ， 通 过 rect 调 用 draw 将 动态 绑 定 到 square 对 象 的 draw 方 法 。 


12.5.4 评估 


人 们 会 目 然 地 将 C++ 的 面向 对 象 的 特性 与 Smalltalk 中 的 同样 的 特性 进行 比较 。 就 访问 控制 
而 言 ，C++ 的 继承 比 Smalltalk 中 的 更 为 复杂 。 通 过 使 用 类 定义 中 的 访问 控制 ， 以 及 派生 的 访问 
控制 ， 加 上 友 元 函数 和 友 元 类 ，C++ 的 程序 人 员 具 有 对 于 类 成 员 进行 访问 的 高 度 细 微 的 控制 。 
此 外 ，C++ 还 提供 了 多 继承 ， 而 Smalltalk 只 允许 单 继 承 ， 尽 管 人 们 对 于 多 继承 的 真实 价值 还 存 
在 着 一 些 争 论 。 

在 C++ 中 ， 程 序 人 员 能 够 指定 是 使 用 静态 绑 定 还 是 使 用 动态 绑 定 。 因 为 静态 绑 定 比较 快速 ， 
在 不 需要 动态 绑 定 的 情况 下 静态 绑 定 具 有 优越 性 。 此 外 ， 甚 至 C++ 中 的 动态 绑 定 较 Smalltalk 中 
的 动态 绑 定 ， 也 还 是 更 为 快速 的 。 在 C++ 中 ， 将 一 个 虚拟 成 员 函 数 调 用 绑 定 于 一 个 函数 的 定义 
有 着 固定 的 代价 ， 而 不 论 出 现在 继承 层次 结构 中 的 这 个 函数 定义 相距 有 多 远 。 与 静态 绑 定 的 调 
用 相 比 ， 虚 拟 函 数 的 调用 只 需要 五 次 额外 的 存储 空间 的 引用 (Stroustrup，1988) 。 然 而 ， 在 
Smalltalk 中 ， 消 息 总 是 动态 地 绑 定 于 方法 ， 并 且 正 确 的 方法 在 继承 阶层 结构 中 相距 越 远 ， 绑 定 
所 耗费 的 时 间 就 越 长 。 由 用 户 来 选择 静态 绑 定 与 动态 绑 定 的 缺点 ， 是 必须 将 这 种 选择 决定 包括 
进 最 初 设计 之 中 ， 但 往往 在 后 面 可 能 又 会 需要 修改 这 个 决定 。 

C++ 的 静态 类 型 检测 与 Smalltalk 的 相 比 ， 是 一 种 主要 的 优越 性 ， 在 Smalltalk 中 ， 所 有 类 型 
检测 都 是 动态 的 。Smalltalk 的 程序 可 以 与 发 送 到 不 存在 方法 的 消息 一 起 编译 ， 直 到 程序 被 执行 
时 才能 够 发 现 这 个 错误 。C++ 编 译 器 则 能 够 发 现 这 种 错误 。 编 译 器 发 现 的 错误 比 在 测试 时 发 现 
的 错误 的 改正 代价 要 低 。 

Smalltalk 基 本 上 是 无 类 型 的 ， 这 意味 着 所 有 代码 实际 上 是 通用 的 。 这 提供 了 极 大 的 灵活 性 ， 
但 牺牲 了 静态 类 型 检测 。C++ 通 过 其 模板 设施 提供 了 通用 的 类 (如 在 第 11 章 中 描述 的 ) ， 这 种 类 
保持 了 静态 类 型 检测 的 优越 性 。 

Smalltalk 的 主要 优点 在 于 语言 的 优雅 与 简单 ， 这 归功 于 其 单一 的 设计 思想 。 这 种 语言 纯粹 
而 且 膏 无 保留 地 贡献 于 面向 对 象 的 范 型 ， 完 全 没有 因为 要 固守 用 户 基础 而 被 迫 妥 协 的 必要 。 然 
而 C++ 是 一 种 庞大 而 复杂 的 语言 ， 除 了 支持 面向 对 象 程 序 设计 以 及 包括 C 的 用 户 基础 之 外 ， 不 具 
有 单一 的 设计 思想 来 作为 基础 。 它 的 最 重要 的 目标 之 一 ， 是 在 提供 面向 对 象 程序 设计 的 优越 性 
的 同时 ， 保 留 C 语 言 的 效率 与 风格 。 有 些 人 认为 这 种 语言 的 一 些 特性 并 不 总 是 相互 适用 的 ， 并 
且 它 的 复杂 性 多 半 也 是 不 必要 的 。 

根据 Chambers and Ungar (1991), Smalltalk 运 行 了 一 套 小 型 的 C 风 格 的 基准 测试 程序 ， 它 
只 具有 优化 的 C 的 10% 的 速度 。C++ 程 序 只 需要 比 等 同 的 C 程 序 稍微 多 一 点 的 时 间 (Stroustrup, 


1988) 。 在 Smalltalk 和 C++ 之 间 效 率 上 有 极 大 差别 的 前 提 下 ，C++ 在 商业 上 的 使 用 远 远 超出 
Smalltalk 就 毫 不 奇怪 了 。 当 然 ， 造 成 这 种 局 面 还 有 其 他 一 些 因素 ， 但 是 效率 显然 是 支持 C++ 的 


一 个 重要 原因 。 


关于 程序 设计 范 型 与 更 优良 的 程序 设计 


BJARNE STROUSTRUP 

Bjarne Stroustrup 是 C++ 的 设计 者 和 最 早 的 实现 者 ， 也 是 《C++ 程 序 设计 语言 》 
和 《C++ 的 设计 与 发 展 》 两 书 的 作者 。 他 的 研究 兴趣 包括 分 布 式 系统 、 模 拟 、 设 计 、 
程序 设计 和 程序 设计 语言 。Stroustrup 博 士 是 美国 Texas A&M 大 学 工学 院 的 计算 机 科 
学 教授 。 他 积极 参与 了 ANSIISO 的 C++ 标准 化 的 工作 。 在 A&M 大 学 工作 了 二 十 多 年 
后 ， 他 仍然 保持 着 与 AT&T 实 验 室 的 联系 ， 作 为 信息 与 软件 系统 研究 实验 室 的 成 员 来 进行 科学 研究 。 他 是 
ACM 的 高 级 成 员 ，AT&T 贝 尔 实验 室 的 高 级 成 员 ， 以 及 AT&T 实 验 室 的 高 级 成 员 。1993 年 ,，“ 由 于 他 早年 
对 于 C++ 程序 设计 语言 的 黄 基 工作 。 在 此 基础 之 上 ，Stroustrup 博 士 继续 的 努力 使 得 C++ 已 经 成 为 计算 机 历 
史上 最 有 影响 力 的 程序 设计 语言 "，Stroustrup 获 得 了 Grace Murray Hopper 奖 。 

I. 程序 设计 范 型 

A): 请 谈 谈 你 对 于 面向 对 象 程序 设计 范 型 的 看 法 : 它 的 优点 和 缺点 。 

E: 首先 让 我 谈 谈 我 的 “面向 对 象 程序 设计 范 型 ”的 意思 是 什么 。 许 多 人 认为 “面向 对 象 ” 就 是 
“好 ”的 同义词 。 如 果 是 这 样 的 话 ， 那 还 需要 其 他 的 范 型 干什么 。 面 向 对 象 的 关键 是 使 用 类 的 层次 ， 通 过 
大 致 相 同 的 虚拟 函数 以 提供 多 态 行为 。 面 向 对 象 的 重要 一 点 是 避免 对 层次 中 数据 的 直接 访问 。 数 据 访问 只 
能 通过 良好 设计 的 函数 接口 。 

除了 它 众 所 周知 的 优点 外 ， 面 向 对 象 程序 设计 也 有 缺点 。 特 别 是 ， 并 非 每 一 种 概念 都 适合 于 类 的 层 
次 。 并 且 ， 比 较 其 他 的 程序 设计 范 型 ， 支 持 面 向 对 象 程序 设计 的 机 制 会 显著 地 增加 开销 。 对 于 许多 简单 的 
抽象 ， 不 依赖 于 层次 与 运行 时 绑 定 的 类 ， 提 供 一 种 更 加 简单 和 高 效 的 方式 。 另 外 ， 在 不 需要 运行 时 决策 的 
地 方 ， 依 赖 于 (编译 时 ) 参数 多 态 的 通用 程序 设计 是 更 好 和 更 高 效 的 方式 。 

lp]; C++ 是 面 癌 对 象 的 还 是 其 他 什么 的 ? 

B: C++ 支持 几 种 程序 设计 范 型 一 一 包括 面向 对 象 程序 设计 、 通 用 程序 设计 和 过 程 程序 设计 。 这 些 程 
序 设 计 范 型 的 结合 定义 了 多 范 型 的 程序 设计 ， 以 支持 多 种 程序 设计 风格 ( 范 型 ) 以 及 那些 风格 的 结合 。 

IF): 你 能 够 给 出 一 个 多 范 型 程序 设计 的 “迷你 ”例子 吗 ? 

E: 芳 虑 经 典 的 “形状 的 集合 ”例子 的 一 个 变种 (此 例 最 早 使 用 在 第 一 个 支持 面向 对 象 程序 设计 的 
语言 ，Simula67 之 中 ) 。 

void draw_all(const vector<Shape*>é& vs) 

{ 





for (int i = 0; i<vs.size(); ++i) 
vs[i]->draw(); 
} 


在 这 里 ， 我 将 通用 包含 器 Vector 与 多 态 类 型 Shape 一 起 使 用 。vector 提 供 静 态 的 类 型 安全 性 和 最 优 
的 运行 时 性 能 。Shape 提 供 在 不 重新 编译 的 情况 下 处 理 一 个 形状 (Shape 派生 类 的 对 象 ) 的 能 力 。 
我 们 可 以 很 容易 地 将 它 一 般 化 为 任何 满足 C++ 标准 库 要 求 的 包含 器 。 


template<class C> 
void draw_all(const C& c) 
{ 
typedef typename C:: 
const_iterator CI; 
for (CP p = c.begin(); 
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p!=c.end(); ++p) 
(*p)- >draw(); 
} 
使 用 循环 器 能 够 使 我 们 将 draw_all( ) 应 用 于 不 支持 下 标的 包含 器 之 上 ， 如 标准 库 的 链表 。 
vector<Shape*> vs; 
list<Shape*> ls; 
PE a -% 
draw_all(vs); 
draw_all(ls); 


我 们 其 至 还 可 以 将 它 进一步 一 般 化 ， 以 便 能 够 处 理 任何 由 一 对 循环 器 定义 的 元 素 序列 ， 


template<class Iterator> void 
draw_all(Iterator b, Iterator e) 
{ 


for_each(b,e,mem_fun(Shape: :Draw) ); 
} 
为 了 简化 实现 ， 我 使 用 了 标准 库 算 法 for_each。 
我 们 可 以 对 标准 库 链 表 和 数组 来 调用 这 个 最 后 版 本 的 draw all(), 


list<Shape*> ls; 

Shape* as[100]; 

on E 

draw_all(ls.begin(),ls.end()); 

draw_all(as,as+100); 

IA-TI “TER” His 

P: 在 多 种 不 同 程序 设计 范 型 中 的 知识 背景 有 用 吗 ? 或 者 说 ， 投 入 时 间 去 进一步 熟悉 面向 对 象 语言 
更 好 呢 ， 还 是 学 习 其 他 范 型 的 语言 更 好 ? 

舍 : 对 任何 希望 被 认为 是 软件 领域 中 的 专业 人 员 的 人 来 说 ， 会 用 多 种 语言 和 多 种 程序 设计 范 型 是 很 
关键 的 。 当 前 ，C++ 是 最 好 的 多 范 型 语言 ， 也 是 学 习 各 种 形式 的 程序 设计 的 好 语言 。 但 是 ， 仅 仅 知道 Ci+ 
丰 不 够 的 。 只 知道 一 种 程序 设计 范 型 语言 是 不 好 的 。 这 有 点 像 色 盲 或 只 会 说 一 种 语言 的 人 。 你 很 难 知 道 你 
造 漏 或 名 略 了 什么 东西 。 好 的 程序 设计 灵感 来 自 于 已 学 到 的 ， 并 且 能 够 鉴赏 多 种 程序 设计 风格 ， 而 且 知 首 
怎样 将 这 些 风 格 使 用 于 不 同 的 语言 之 上 。 

此 处， 我 认为 任何 并 非 微不足道 的 程序 的 程序 设计 是 具有 坚实 而 广泛 教育 背景 的 专业 人 员 的 工作 ， 
而 不 古 那 些 只 经 过 匆忙 而 又 狭窄 的 “培训 ”的 人 的 工作 。 


a es EI oh 
12.6 Java 对 面向 对 象 程序 设计 的 支持 


Java 中 的 类 、 继 承 和 方法 的 设计 与 C++ 中 的 相 类 似 ， 所 以 我 们 在 这 一 节 里 仅仅 将 注意 力 集 
中 于 Java 与 C++ 的 不 同 之 处 。 


12.6.1 一 般 特征 


如 同 在 C++ 中 一 样 ，Java 并 不 仅仅 使 用 对 象 。 然 而 在 Java 中 ， 只 有 原始 数量 类 型 (布尔 类 型 、 
字符 类 型 及 数值 类 型 ) 的 值 不 是 对 象 。Java 中 的 枚 举 和 数组 是 对 象 。 效 率 是 使 得 Java 具 有 非 对 
象 实体 的 理由 。 然 而 ， 如 在 12.3.1 节 中 所 讨论 过 的 ， 存在 着 的 两 种 类 型 系统 导致 了 一 些 不 方便 的 
情形 。 在 Java 中 一 种 情形 是 预定 义 的 包含 器 的 类 ， 例如 ArrayList 只 能 包含 对 象 。 因 而 如 果 你 
想 要 将 一 个 原始 类 型 的 值 放 入 ArrayList 的 对 象 ， 就 必须 首先 将 这 个 值 放置 于 一 个 对 象 之 中 ， 
在 Java 5.0 之 前 的 版 本 中 ， 这 可 以 通过 为 这 个 原始 类 型 创建 一 个 新 的 包装 类 的 对 象 来 完成 。 这 样 
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的 一 个 类 具有 这 个 原始 类 型 的 实例 变量 以 及 一 个 构造 器 ， 它 接受 原始 类 型 的 值 作 为 参数 ， 并 将 
这 个 值 赋 给 它 的 实例 变量 。 例 如 ， 如 果 要 将 10 放 入 变量 myArray 所 引用 的 ArzayList 对 象 ， 
我 们 就 可 以 使 用 下 面 的 语句 : 

myArray.add(new Integer(10)); 


这 里 add 是 ArrayList 的 一 个 插入 新 元 素 的 方法 ，Integer 是 int 的 包装 类 。 当 将 一 个 值 
从 myRrray 移 出 并 赋 给 一 个 int 变 量 时 ， 这 个 值 的 类 型 必须 转换 回 int 类 型 。 

在 Java5.0 中 ， 这 种 工作 变 得 容易 。 当 把 一 个 原始 类 型 的 值 放 在 对 象 的 环境 中 时 ， 先 对 这 个 
值 进行 隐 式 的 强制 转换 ， 如 作为 多 数 传送 到 ArrayList 的 add 方 法 。dt 强 制 转换 基本 值 为 基本 
值 类 型 包装 类 的 对 象 。 例 如 ， 把 int 值 或 变量 放 人 对 象 的 环境 中 会 引起 创建 1nt 基 本 类 型 值 的 
Integer 对 象 。 这 种 强制 转换 称 为 包装 (boxing)。 例 如 在 Java5.0 中 ， 下 面 的 语句 是 合法 的 : 


myArray.add(10); 


Hilt as oe M inti] Integer, 

同样 地 ， 当 一 个 值 从 myRrray 移 出 并 赋 给 一 个 int 变 量 时 ， 它 的 类 型 被 隐 式 地 转换 为 int 
类 型 。 

虽然 可 以 将 C++ 中 的 类 定义 为 不 存在 父 类 ， 在 Java 中 的 类 却 不 可 以 这 样 来 定义 。Java 中 的 所 
有 类 都 必须 是 根 类 Object 的 子 类 ， 或 者 是 Object 的 后 代 类 的 子 类 。 设 置 单个 根 类 的 原因 之 一 
是 因为 有 一 些 操作 是 普遍 需要 的 。 这 些 操作 中 的 一 种 就 是 一 个 比较 对 象 是 否 相等 的 方法 . 

所 有 的 Java 对 象 都 是 显 式 堆 动态 的 。 大 多 数 是 用 new 操 作 符 来 分 配 ， 但 是 却 没 有 显 式 解除 
分 配 操作 符 。 废 料 收集 被 用 于 存储 空间 的 回收 。 如 同 其 他 许多 语言 特征 一 样 ， 虽 然 废料 收集 可 
以 避免 一 些 严 重 的 问题 ， 例 如 虚 悬 的 指针 等 ， 但 也 会 引起 其 他 的 一 些 问 题 。 其 中 的 一 个 问题 是 
废料 收集 句 只 回收 对 象 所 占用 的 存储 空间 ， 而 不 进行 其 他 的 一 些 事情 。 例 如 一 个 对 象 没有 访问 
堆 存 储 空间 而 是 访问 别 的 资源 ， 如 文件 或 共享 资源 上 的 锁 ， 废 料 收集 器 就 不 会 回收 这 些 东 西 。 
为 了 处 理 这 些 情 况 ，Java 中 包括 了 与 C++ 中 的 析 构 函数 相关 的 一 个 特殊 方法 ，finalize。 

当 废 料 收集 器 要 收集 对 象 占 用 的 存储 空间 时 ，finalize 方 法 则 被 隐 式 地 调用 ， 
finalize 方 法 的 问题 是 它 所 运行 的 时 间 是 不 可 强制 甚至 是 不 可 预测 的 。finalize 方 法 的 一 
种 替代 是 定义 一 个 回收 方法 。 这 样 做 的 唯一 问题 是 对 象 的 所 有 客户 必须 知道 有 这 么 一 个 方法 ， 
并 且 必 须 能 够 记 住 调用 它 。 


12.6.2 继承 


在 Java 中 ， 一 个 方法 可 以 被 定义 为 final， 这 意味 着 这 个 方法 不 能 够 被 覆盖 于 任何 后 裔 类 
之 中 。 当 使 用 保留 字 final 来 对 一 个 类 的 定义 进行 说 明 时 , 这 意味 着 这 个 类 不 能 够 是 任何 子 类 的 
父 类 。 

Java 仅 仅 古 直接 支持 单 继 承 。 但 是 Java 包 括 了 一 种 被 称 为 接口 的 虚拟 类 ， 它 提供 了 一 种 多 继 
承 的 版 本 。 接 口 的 定义 与 类 的 定义 相似 ， 只 是 接口 仅仅 能 够 包括 命名 常数 以 及 方法 声明 (而 不 
FETE) 。 在 不 能 包含 构造 器 或 非 抽象 方法 。 因 而 正如 接口 的 名 字 所 指示 的 那样 ， 它 只 是 定义 类 
的 说 明 。( 回 忆 C++ 的 抽象 类 可 以 具有 实例 变量 ， 并 且 可 以 完全 定义 除了 一 个 方法 之 外 的 所 有 
方法 。) 类 不 继承 接口 ， 它 实现 它 。 实 际 上 ， 类 能 够 实现 任意 数量 的 接口 。 为 了 实现 接口 ， 类 必 
须 实 现 所 有 规格 出 现在 接口 定义 中 的 方法 。 

接口 能 用 来 模拟 多 继承 。 带 有 替代 第 二 个 父 类 的 接口 的 类 能 从 类 中 派生 并 实现 接口 。 有 时 ， 
这 称 为 混合 (mix-in) 继承 ， 因 为 接口 的 常量 和 方法 与 从 超 类 继承 的 方法 和 数据 混合 在 一 起 ， 
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任何 在 子 类 中 定义 的 新 数据 和 方法 也 一 样 。 

接口 的 另 一 个 有 趣 的 功能 是 它们 提供 了 另 一 种 多 态 。 这 是 因为 接口 能 处 理 类 型 。 例 如 ， 方 
法 能 指定 是 接口 的 形 参 。 这 种 形 参 能 接受 任何 接口 实现 的 类 的 实 参 ， 这 使 方法 具有 多 志 性 。 

非 参 数 变量 也 能 声明 为 接口 的 类 型 。 这 种 变量 能 引用 任何 接口 实现 的 类 的 任何 对 象 。 

当 一 个 类 从 两 个 父 类 派生 ， 并 且 都 用 同样 的 名 称 和 协议 定义 了 公有 方法 时 ， 一 个 多 继承 的 
问题 将 会 出 现 。 因 为 实现 接口 的 类 必须 提供 接口 指定 的 所 有 方法 的 定义 ， 所 以 此 问题 可 用 接口 
来 解决 。 如 果 父 类 和 接口 都 包括 带 有 同样 名 称 和 协议 的 方法 ， 那 么 子 类 必须 重新 实现 该 方法 。 
而 且 ， 在 多 继承 出 现 的 命令 冲突 在 单 继承 和 接口 中 不 会 出 现 。 

接口 并 不 是 多 继承 的 替代 ， 因 为 多 继承 提供 代码 重用 ， 而 接口 却 不 能 提供 。 这 是 它们 间 重 
大 的 不 同 处 ， 因 为 代码 重用 是 继承 最 大 的 优 扣 。 

作为 接口 的 一 个 示例 ， 我 们 考虑 标准 Java 类 Arrays 的 sort 方 法 。 任 何 使 用 这 个 方法 的 类 
都 必须 提供 一 个 方法 的 实现 来 比较 被 排序 的 元 素 。Comparable 接 口 对 这 个 用 来 比较 元 素 的 方 
法 提供 协议 。 这 个 方法 称 为 CompareTo。Comparab1le 接 口 的 代码 如 下 : 


public interface Comparable { 
public int compareTo(Object b); 


} 


如 果 调 用 CompareTo 方 法 的 对 象 是 在 参数 对 象 之 前 ， 这 个 方法 将 返回 一 个 负 整 数 。 如 果 相 
等 的 话 ， 则 返回 零 值 。 如 果 调 用 CompareTo 方 法 的 对 象 是 在 参数 对 象 之 后 ， 这 个 方法 将 返回 一 
个 正 整 数 。 实 现 Comparab1le 接 口 的 类 ， 可 以 对 于 任何 数组 的 内 容 进 行 排序 ， 只 要 实现 的 
CompareTo 方 法 提供 合适 的 值 。 

第 14 章 描述 Java 中 如 何 使 用 接口 来 进行 事件 处 理 。 


12.6.3 JARE 


在 C++ 中 必须 将 一 个 方法 定义 为 虚拟 的 ， 坎 便 人 允许 动 态 绑 定 。 在 Java 中 ， 所 有 的 方法 调用 
都 是 动态 绑 定 的 ， 除 了 这 个 被 调用 的 方法 已 经 被 定义 为 final 以 外 ， 而 且 在 这 种 情况 下 这 个 方 
法 就 不 能 够 被 覆盖 ， 并 且 所 有 的 绑 定 都 是 静态 的 。 如 果 一 个 方法 是 static 或 Private 的 ， 也 
将 使 用 静态 绑 定 。static 和 PTivate 的 方法 不 能 够 被 覆盖 。 


12.6.4 WREX 


Java 具 有 好 几 种 被 骨 套 的 类 。 这 些 类 的 优点 之 一 ， 是 除了 和 藤 套 它们 的 类 而 外 ， 对 于 包 中 的 
其 他 的 类 ， 它 们 是 不 可 见 的 。 直 接 定 义 在 另 一 个 类 中 的 非 静 态 类 ， 有 一 个 指向 岁 套 类 的 隐 式 的 
指针 。 这 个 指针 允许 被 租 套 的 类 的 方法 访问 嵌 套 类 中 的 所 有 成 员 。 如 果 一 个 被 垦 套 的 类 是 静态 
的 ， 则 不 具有 这 个 指针 ， 因 而 就 不 能 访问 舱 套 类 中 的 成 员 。 因 此 Java 中 的 静态 的 被 嵌 套 的 类 十 
分 类 似 于 C++ 中 被 修 套 的 类 。 

被 秘 套 的 类 也 可 以 是 匿名 的 。 匿 名 的 类 具有 复杂 的 语法 。 如 果 一 个 类 只 在 一 个 地 方 使 用 ， 
这 就 是 一 简练 的 方法 。 

也 可 以 将 一 个 局 部 被 徐 套 的 类 定义 在 瞬 套 类 的 方法 之 中 。 局 部 被 代 套 的 类 从 来 不 使 用 访问 
说 明 符 (如 private 或 public) 来 进行 定义 。 总 是 将 它们 的 作用 域 限制 在 它们 的 骸 套 类 之 中 。 
一 个 局 部 被 瞬 套 的 类 中 的 方法 ， 可 以 访问 定义 在 其 嵌 套 类 中 的 变量 以 及 定义 在 其 方法 中 的 
final 变 量 。 只 有 定义 局 部 被 峰 套 的 类 的 方法 才 可 以 访问 其 内 部 的 成 员 。 
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12.6.5 评估 

Java 的 支持 面向 对 象 程序 设计 的 语言 设计 与 C++ 中 的 相 类 似 ， 然 而 Java 与 面向 对 象 的 原则 紧 
密 地 保持 着 一 致 。 由 于 Java 中 不 具有 函数 ， 所 以 Java 不 支持 过 程 程序 设计 。 此 外 ，Java 不 介 许 没 
有 父 类 的 类 。 它 还 使 用 动态 绑 定 作为 一 种 “正常 ”的 方式 来 将 方法 的 调用 绑 定 于 方法 定义 。 比 
较 C++ 中 的 访问 控制 之 复杂 情形 (从 派生 控制 到 友 元 函数 ) ，Java 中 对 于 类 定义 内 容 的 访问 控制 
则 征 十 分 简单 的 。 最 后 ，Java 使 用 接口 提供 了 一 种 简单 的 形式 以 支持 多 继承 ， 而 C++ 则 包括 了 
完整 然而 复杂 的 形式 来 支持 多 继承 。 


12.7 C# 对 面向 对 象 程序 设计 的 支持 
C# 对 于 面向 对 象 程序 设 计 的 支持 与 Java 中 的 相 类 似 。 
12.7.1 一 般 特征 
正如 在 第 11 章 中 所 讨论 的 ，C# 包 括 了 类 和 结构 (struct). C# 中 的 类 与 Java 中 的 类 十 分 相似 ， 
其 中 的 struct 为 能 力 稍 差 的 栈 动 态 结构 。 
12.7.2 继承 
C# 使 用 C++ 的 文法 来 定义 类 。 例 如 ， 


public class NewClass : ParentClass { ... } 


从 父 类 继承 的 方法 ， 可 以 在 派生 的 子 类 中 被 替代 ， 这 需要 在 子 类 中 的 替代 方法 前 面 加 上 
new。 对 于 一 般 的 访问 ， 这 个 带 有 new 的 方法 将 父 类 中 相同 名 称 的 方法 隐藏 起 来 ， 但 只 需要 在 
方法 名 称 上 加 以 前 缀 base， 就 仍然 可 以 访问 父 类 中 的 方法 。 例 如 ， 


base.Draw( ); 


与 Java 相 同 ，C# 支 持 接 口 。 


12.7.3 动态 绑 定 


在 C# 中 ， 要 将 方法 调用 动态 地 绑 定 于 方法 ， 必 须 将 基 方 法 ( 即 原 定 义 的 方法 ) 和 它 在 派生 
类 中 的 对 应 方法 都 给 以 标记 。 如 同 在 C++ 中 的 那样 ， 必须 将 基 方法 标 上 virtual。 为 了 避免 事 
故 性 的 覆盖 ， 必须 将 派生 类 中 的 对 应 方法 都 标 上 override。 override 标 记 将 清楚 地 指示 出 ， 
这 征 所 继承 方法 的 一 个 新 的 版 本 。 例 如 ， 下 面 是 12.5.3 节 中 的 C++ Shape 类 的 C# 版 本 : 


public class Shape { 
public virtual void Draw() { ... } 


} 
public class Circle : Shape { 
public override void Draw() { ... } 


} 
public class Rectangle : Shape { 
public override void Draw() { ... } 


public class Square : Rectangle { 
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public override void Draw() { --- } 


} 
534 C# 中 包括 类 似 于 C++ 中 的 抽象 方法 ， 但 是 使 用 不 同 的 文法 来 说 明 。 例 如 ， 下 面 是 一 个 C# 的 

抽象 方法 : 

abstract public void Draw(); 

包含 至 少 一 个 抽象 方法 的 类 是 抽象 类 ， 每 个 抽象 类 必须 使 用 abstract 来 标记 。 抽 和 象 类 不 能 
被 实例 化 。 将 要 实例 化 的 抽象 类 的 任何 子 类 都 必须 实现 其 继承 的 所 有 抽象 方法 。 

如 同 在 Java 中 的 那样 ， 所 有 C# 的 类 都 从 根 类 0bject 派 生 而 来 。 根 类 Object 定 义 了 一 组 方 
法 ， 包 括 ToString，Finalize 和 Equals; 所 有 C# 的 类 型 都 继承 这 些 方法 。 


12.7.4 WREX 
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行为 相 类 似 。( 后 者 的 行为 又 与 Ct+ 中 的 嵌 套 类 的 行为 相 类 似 。) C# 不 支持 类 似 于 Java 中 的 非 静 
MRE : 


12.7.5 评估 


因为 C# 是 近年 设计 的 基于 C 的 语言 ， 人 们 应 该 能 够 想像 到 ，C# 的 设计 人 员 从 前 面 语言 的 设 
计 中 学 习 了 很 多 东西 。 他 们 可 以 照搬 过 去 成 功 的 经 验 ， 而 去 除 一 些 前 面 语 言 中 的 问题 。 这 样 的 
一 种 结果 即 是 ， 附 加 上 了 Java 中 的 少量 问题 。 在 对 于 面 四 对 象 程 序 设 计 的 支持 上 ，C# 与 Java 的 
差别 相对 较 小 。 


12.8 Ada 95 对 面向 对 象 程序 设计 的 支持 


Ada 95 源 于 Ada 83， 并 在 Ada 83 的 基础 上 进行 了 一 些 重要 的 扩展 。 这 一 市 将 简略 地 探讨 被 
设计 来 支持 面向 对 象 程序 设计 的 这 些 扩 展 。 正 如 在 第 11 章 里 曾经 讨论 过 的 ，Ada 83 已 经 包括 了 
建造 抽象 数据 类 型 的 结构 ， 余 下 的 必要 特性 就 是 那些 支持 继承 与 动态 绑 定 的 特性 。 设 计 这 些 特 
性 的 目的 包括 对 于 Ada 83 的 类 型 与 包 的 结构 所 需要 的 尽 可 能 小 的 改变 ， 以 及 保持 尽 可 能 多 的 静 
态 类 型 检测 。 


12.8.1 一 般 特征 


Ada 95 中 的 类 是 一 种 被 称 为 标志 类 型 (tagged type) 的 新 类 型 ， 它 们 可 以 是 记录 类 型 也 可 
以 是 私有 类 型 。 它 们 被 定义 在 包 之 中 ， 这 就 允许 它们 被 分 别 编译 。 之 所 以 将 它们 命名 为 标志 类 
型 ， 是 因为 标志 类 型 的 每 一 个 对 象 都 隐 式 地 包括 了 一 个 指示 其 类 型 的 、 由 系统 来 维护 的 标志 。 
[535] ”定义 标志 类 型 上 的 操作 的 子 程序 ， 出 现在 与 类 型 声明 相同 的 声明 表 中 。 考 虑 下 面 的 这 个 例子 : 


package Person Pkg is 

type Person is tagged private; 

procedure Display(P : in Person); 

private 

type Person is tagged 
record 

Name : String(1..30); 
AddressS : String(1..30); 
Age : Integer; 
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end record; 
end Person Pkg; 


这 个 包 定 义 了 类 型 Person， 这 种 类 型 本 身 可 以 作为 类 来 使 用 ， 也 可 以 用 来 作为 其 他 派生 
不 像 在 C++ 中 的 那样 ，Ada 95 中 不 具有 构造 器 或 析 构 器 子 程序 的 隐 式 调用 。 尽 管 也 可 以 编 
写 这 样 的 子 程序 ， 但 是 这 些 子 程序 必须 由 程序 人 员 来 显 式 地 调用 。 


12.8.2 继承 


Ada 83 仅 仅 支持 派生 类 型 与 子 类 型 中 的 具有 受 限 形式 的 继承 。 在 这 两 种 受 限 形式 的 继承 中 ， 
可 以 在 已 有 类 型 的 基础 之 上 定义 一 种 新 的 类 型 。 但 是 唯一 被 允许 的 修改 只 是 限制 新 的 类 型 值 的 
范围。 a 
这 不 是 面向 对 象 程序 设计 所 需要 的 完全 的 继承 。Ada 95 支 持 了 面向 对 象 程序 设计 。 
Ada 95 中 的 派生 类 是 以 标志 类 型 为 基础 的 。 通 过 包括 进 一 种 记录 定义 ， 可 以 将 新 的 实体 增 
加 到 被 继承 的 实体 之 中 。 考 虑 下 面 这 个 例子 : 
with Person Pkg; use Person Pkg; 
package Student Pkg is 
type Student is new Person with 
record 
Grade Point Average : Float; 
Grade Level : Integer; 
end record; 
procedure Display(St : in Student); 
end Student Pkg; 


在 此 例 中 ， 派生 类 型 student 被 定义 为 具有 其 父 类 Person 的 实体 以 及 新 的 实体 
Grade Point Average 和 Grade Level, 这 个 例子 也 重新 定义 了 过 程 Display，。 这 个 新 的 
类 被 定义 于 一 个 分 离 的 包 中 ， 这 样 就 允许 了 对 于 它 所 进行 的 修改 将 不 会 引起 包含 其 父 类 型 定义 

这 种 继承 机 制 没有 办 法 阻止 父 类 的 实体 被 包括 在 派生 类 之 中 。 其 后 果 是 ， 派生 类 只 能 够 扩充 
父 类 ， 并 因此 成 为 子 类 型 。 然 而 下 面 将 要 简略 讨论 的 子 库 包 ， 能 够 被 用 来 定义 不 是 子 类 型 的 子 类 。 

假设 我 们 具有 下 面 的 定义 : 

Pl : Person; 

S1 : Student; 


Fred : Person:= ("Fred", "321 Mulberry Lane", 35); 
Freddie : Student:= ("Freddie", "725 Main St.", 20, 3.25, 
3); 


因为 student 是 Person 的 子 类 型 ， 赋 值 语句 

Pl := Freddie; 

应 该 是 合法 的 ， 事实 上 它 也 是 合法 的 。 Freddie 的 两 个 实体 Grade_Point_RAverage 和 
Grade_ Level1 在 必需 的 强制 转换 中 被 省 略 。 

现在 一 个 明显 的 问题 是 ， 相 反方 向 的 赋值 是 否 也 是 合法 的 ， 也 就 是 说 ， 我 们 能 够 将 一 个 
Person 峰 给 一 个 Student 吗 ? 在 Ada 95 中 ， 只 要 所 赋 的 值 包括 了 子 类 的 实体 ， MERER. 
在 我 们 的 例子 中 ， 下 面 的 形式 是 合法 的 ; 


SL 1s (Fred; 3.05; 2) 


Nn 
~ 
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要 派生 一 个 不 包括 所 有 父 类 的 实体 的 类 ， 就 需要 使 用 子 库 包 。 子 库 包 是 一 个 使 用 父 库 包 的 
名 字 作 为 其 名 字 的 前 组 的 包 。 也 可 以 将 子 库 包 用 于 C++ 中 友 元 定义 的 位 置 。 例如 ， 如 果 必 须 编 
写 一 个 能 够 访问 两 个 不 同类 的 成 员 的 子 程序 ， 父 包 就 可 以 定义 其 中 的 一 个 类 ， 而 子 包 则 可 以 定 
义 另外 的 一 个 类 。 然 后 一 个 子 包 中 的 子 程序 就 能 够 访问 这 两 个 类 的 成 员 。 
Ada 95 不 提供 多 继承 。 虽然 通 用 类 和 多 继承 是 两 个 相差 其 远 的 概念 ， 但 使 用 通用 类 也 可 以 达到 
多 继承 的 效果 。 然 而 这 个 方法 却 不 如 C++ 中 的 那么 优雅 。 关 于 这 一 扩 ， 我 们 将 不 在 这 里 进行 讨论 。 


12.8.3 动态 绑 定 


Ada 95 在 标志 类 型 中 提供 了 过 程 调用 与 函数 定义 的 静态 绑 定 与 动态 绑 定 。 通过 使 用 类 范围 
(classwide) 类 型 来 强制 进行 动态 绑 定 ， 这 种 类 型 代表 了 一 个 类 层次 中 的 所 有 类 型 。 这 个 类 层次 
的 根 是 其 一 类 型 。 每 一 个 标志 类 型 都 隐 含 地 有 一 个 类 范围 类 型 。 对 于 标志 类 于 了， 这 种 类 范围 
类 型 被 使 用 T'class 来 说 明 。 如 果 T 是 一 个 标志 类 型 ， 那么 一 个 zclass 的 变量 的 类 型 可 能 是 
T 也 可 能 是 z 的 任何 派生 类 型 。 

在 这 里 我 们 再 一 次 来 考虑 12.8.2 节 中 定义 的 person 和 Student 两 个 类 。 假 设 我 们 有 一 个 变 
量 Pcw， 其 类 型 为 Person'class。 这 个 变量 有 时 引用 一 个 Person 对 象 ， 有 了 时 引用 一 个 
student 对 象 。 进 一 步 地 假设 我 们 想 要 显示 Pcw 所 引用 的 对 象 ， 而 不 论 它 是 Person 对 象 还 十 
student 对 象 。 这 就 要 求 必须 将 对 于 Display 的 调用 动态 地 绑 定 到 正确 的 Display 版 本 上 。 
我 们 可 以 使 用 一 个 新 的 过 程 来 接受 一 个 Person 类 型 的 参数 ， 并 将 这 个 参数 传送 给 Display。 
下 面 就 是 这 样 的 一 个 过 程 : 

procedure Display Any Person(P: in Person) is 

begin 
Display(P); 
end Display Any Person; 

这 个 过 程 可 以 被 以 下 两 个 调用 来 调用 : 

with Person Pkg; use Person_Pkg; 

with Student Pkg; use Student_Pkg; 

P : Person; l 


S : Student; 
Pew : Person’class; 


Pew := P; 


Display Any Person(Pcw); -- call the Display in Person 
Pew := S; 
Display Any Person(Pcw); -- call the Display in Student 


Ada 95 也 支持 多 态 指针 。 这 些 多 态 指 针 被 定义 为 具有 类 范围 类 型 ， 例 如 


type Any Person Ptr is access Person'class; 


在 Ada 95 中 ， 通 过 将 保留 字 abstract 包 括 进 类 型 定义 和 子 程序 定义 中 ， 从 而 可 以 定义 纯 
抽象 基 类 型 。 此 外 ， 子 程序 定义 不 能 够 具有 体 。 考 虑 下 面 的 例子 : 
package Base Pkg is 
type T is abstract tagged null record; 


procedure Do It (A : T) is abstract; 
end Base Pkg; ， 
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12.8.4 FEFE 


可 以 将 一 个 程序 包 直 接 艇 套 在 其 他 的 程序 包 中 ， 这 时 就 称 之 为 子 程序 包 (child package), 
这 种 设计 的 问题 是 ， 如 果 一 个 程序 包 有 着 很 大 数目 的 子 程序 包 ， 而 且 这 些 子 程序 包 都 很 大 ， 这 
个 嵌 套 程序 包 就 会 变 得 很 大 ， 以 致 不 能 够 成 为 一 个 有 效 的 编译 单位 。 这 个 问题 的 解决 方案 比较 
咖 单 :允许 子 程序 包 成 为 单独 的 单位 ， 并 且 可 以 被 分 开 编译 。 子 程序 包 的 名 字 就 是 嵌 套 程序 包 
的 名 字 、 再 加 上 子 程序 包 自 己 的 名 字 ， 中 间 使 用 句号 分 隔 开 。 例 如 ， 如 果 幅 套 程序 包 的 名 字 是 
Binary_Tree, 了 于 程序 包 自己 的 名 字 是 Traversals， 那么 子 程序 包 的 全 名 就 是 
Binary Tree.Traversals, . 

于 程序 包 可 以 是 公有 的 (RU) 或 私 用 的 。 一 个 公有 的 子 程序 包 的 位 置 ， 是 在 嵌 套 程序 包 
的 说 明 包 之 声明 部 分 的 尾部 。 因 此 ， 在 嵌 套 程序 包 的 说 明 包 中 所 声明 的 所 有 实体 ， 对 子 程序 包 
都 是 可 见 的。 然而 ， 任 何 出 现在 幅 套 程序 包 的 体 中 的 声明 ， 对 于 子 程序 包 都 是 不 可 见 的 。 如 果 
有 多 个 子 程序 包 ， 它 们 之 间 没 有 逻辑 上 的 顺序 。 所 以 ， 一 个 子 程序 包 不 能 够 看 见 另 一 个 子 程序 
包 的 声明 ， 除 非 它 包含 有 一 个 带 有 其 他 子 程序 包 名 字 的 with 子 句 ， 

将 保留 字 private 放 在 保留 字 package 之 前 ， 就 可 以 将 一 个 子 程序 包 声 明 为 私 用 的 。 一 个 
私 用 了 于 程序 包 的 逻辑 位 置 是 在 嵌 套 程序 包 的 说 明 包 的 声明 部 分 的 首部 。 对 于 幅 套 程序 包 的 休 . — 
个 私 用 子 程序 包 的 声明 是 不 可 见 的 ， 除 非 嵌 套 程序 包含 有 带 有 该 子 程序 包 名 字 的 with 子 句 


12.8.5 评估 


Ada 对 面向 对 象 程序 设计 提供 了 完全 的 支持 ， 尽 管 其 他 面向 对 象 程序 设计 语言 的 用 会 觉 
得 Ada 的 支持 是 弱 的 。 虽 然 程序 包 可 以 用 来 创建 抽象 数据 类 型 ， 但 它们 实际 上 是 更 一 般 化 的 圭 
包 构 造 。 除 非 使 用 子 程序 库 包 ， 否 则 无 法 限制 继承 ， 在 这 种 情况 下 ， 所 有 的 子 类 都 是 子 类 型 
相 比 C++、Java 和 C#， 这 种 形式 的 访问 限制 是 有 限 的 。 

C++ 显然 提供 了 一 种 比 Ada 95 的 更 好 的 多 继承 形式 。 然 而 ， 使 用 子 库 单位 来 控制 对 父 类 实 
体 的 访问 似乎 是 比 C++ 中 的 友 元 函数 和 类 更 为 清晰 的 解决 办 法 。 例 如 ， 如 果 当 定义 一 个 类 时 不 
知 着 古 否 需要 友 元 ， 而 当 发 现 有 这 种 需要 时 ， 将 必须 改变 和 重新 编译 这 个 类 的 定义 ， 存 Ada 95 
中 ， 可 以 定义 新 的 子 包 里 的 新 类 而 不 打扰 父 包 ， 原 由 是 对 子 程序 包 来 说 ， 每 一 个 定义 在 父 程序 


包 中 的 名 字 都 是 可 见 的 。 
C++ 中 包括 用 来 对 对 象 进行 初始 化 的 构造 器 和 析 构 器 ， 这 是 十 分 优良 的 设计 。 而 Ada 95 就 
没有 包括 这 种 功能 。 


这 两 种 语言 之 间 的 另外 一 种 差别 ， 是 C++ 的 根 类 的 设计 人 员 必 须 决定 ， 某 一 特定 成 员 函 数 
到 抵 应 该 是 静态 绑 定 还 是 动态 绑 定 。 如 果 是 选择 静态 绑 定 ， 然 而 系统 后 来 又 需要 改变 为 动态 绑 
定 的 话 ， 则 必须 改变 根 类 。 在 Ada 95 中 ， 这 种 设计 决定 不 必 与 根 类 的 设计 联系 在 一 起 。 每 一 个 539 
调用 的 自身 可 以 说 明 究竟 会 静态 绑 定 还 是 动态 绑 定 ， 而 不 论 根 类 是 如 何 设计 的 ， 
一 和 更 为 细微 的 差别 是 ， 将 基于 C 的 语言 中 的 动态 绑 定 仅仅 限制 于 指针 和 (或 ) 对 象 的 引用 
而 并 非 对 象 的 自身 。Ada 95 中 就 没有 这 种 限制 ， 因 而 在 这 种 情况 下 Ada 95 更 为 正 交 化。 


12.9 _ Ruby 对 面向 对 象 程序 设计 的 支持 


正如 前 面 讲述 的 ， 与 Smalltalk 类 似 ，Ruby 是 一 种 纯 面向 对 象 程序 设计 语言 。 它 虚拟 化 所 有 
一 四 为 对 象 ， 并 且 通过 消息 传递 来 完成 所 有 计算 。 尽 管 程序 有 使 用 中 组 操作 符 的 表达 式 ， 还 有 
Java 语 言 相似 的 表达 式 外 观 ， 实 际 上 这 些 表达 式 通过 消息 传递 来 求 值 。 当 计算 a+b 时 ， 它 发 
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送 消息 + 给 a 引用 的 对 象 ， 并 传递 引用 给 对 象 b。 
12.9.1 一 般 特征 


回忆 第 11 章 ，Ruby 类 定义 与 Ct++ 和 Java 等 语言 不 同 ， 因 为 它们 都 是 可 执行 的 。 这 允许 它们 
在 执行 期 间 保持 开放 性 ， 允 许 程序 通过 简单 提供 包含 新 成 员 的 类 的 二 次 定义 来 多 次 添加 类 。 在 
执行 期 间 ， 类 的 当前 定义 是 已 经 执行 的 类 的 所 有 定义 的 联合 。 方 法 定义 也 是 可 执行 的 ， 这 使 程 
序 在 执行 期 间 通 过 简单 地 把 两 种 定义 放 入 选择 结构 的 then 和 else 分 句 里 来 选择 一 种 方法 定义 。 

Ruby 的 所 有 变量 都 是 对 对 象 的 引用 并 且 都 是 无 类 型 的 ， 所 有 实例 变量 名 都 以 标记 8 开头 。 
Ruby 与 其 他 常用 程序 设计 语言 的 明显 区 别 是 ，Ruby 的 访问 控制 在 访问 数据 和 访问 方法 上 不 同 。 
所 有 实例 数据 默认 下 都 是 私有 访问 的 ， 并 且 不 能 改变 。 如 果 需 要 对 实例 变量 进行 外 部 访问 ， 必 
须 定 义 访问 方法 。 例 如 ， 考 虑 下 面 的 类 定义 框 染 : 


class MyClass 
# Ai at 


def initialize 
@one i 
@two 2 

end 


# 获取 one 


def one 
@one 
end 


# 设置 one 


def one=(my one) 
@one = my one 
end 


end #MyClass# 


设置 方法 名 后 连接 = 标记 说 明 它 的 变量 是 可 赋值 的 。 因 此 ， 所 有 设置 方法 都 有 等 号 连接 它们 
的 名 称 。one 获 取 方 法 体 说 明 当 没有 返回 语句 时 Ruby 设 计 为 让 方法 返回 上 个 表达 式 求 值 的 结果 。 
这 个 例子 返回 aone 的 值 。 

因为 需要 频繁 使 用 获取 和 设置 方法 ，Ruby 提 供 了 两 者 的 快捷 方式 。 如 果 一 个 类 有 两 个 实例 
变量 的 获取 方法 sone 和 etwo， 那 么 这 些 获 取 方 法 能 通过 类 中 单一 语句 来 指定 


attr reader :one, :two 


attr-reader 实 际 上 是 使 用 :one 和 :two 作 为 实 参 的 函数 调用 。 在 变量 前 加 冒号 : 表示 变 
量 名 被 使 用 ， 而 不 是 取消 其 引用 对 象 的 引用 。 

类 似 地 创建 设置 方法 的 函数 称 为 attr_wFiter。 该 国 数 有 与 attr_reader 相 同 的 参数 列表 。 

创建 获取 方法 和 设置 方法 的 函数 都 是 指定 的 ， 因 为 它们 为 类 的 对 象 提供 了 协议 (在 Ruby 中 
称 为 属性 )。 因 此 类 的 属性 是 对 类 对 象 的 数据 接口 (公有 数据 )。 

因为 对 Ruby 方 法 的 访问 控制 是 动态 的 ， 所 以 访问 违例 只 能 在 执行 时 检测 到 。 默 认 的 方法 访 
问 是 公有 的 ， 但 是 它 也 能 是 保护 的 或 私有 的 。 指 定 访问 控制 有 两 种 方式 ， 它 们 都 使 用 带 有 同样 


RAG BAT RAG AZ JF TT 363 


名 称 的 函数 作为 访问 控制 (private、protected 和 public)。 一 种 方式 是 调用 没有 参数 的 
合适 的 国 数 。 这 重 设 了 随后 在 类 中 定义 的 方法 的 默认 访问 权限 。 例 如 ， ` 


class MyClass 
def methl 


end 
private 
def meth7 
end 
as ere 
def methll 
end 
oa d of class MyClass 
可 替换 的 方法 是 调用 把 具体 方法 名 作为 参数 的 访问 控制 函数 。 例 如 ， 下 面 的 类 定义 在 语义 
上 是 与 前 面 等 价 的 : 


class MyClass 
def methl 


end 

def meth7 

end 

def meth11 

end 

PE smeth7, aso 


protected :meth11, .. 
end # of class MyClass 


类 变量 通过 在 它们 名 称 前 加 两 个 标记 (ee) 来 指定 ， 它 们 对 类 和 其 实例 是 私有 的 。 私 有 性 
不 能 改变 。 与 全 局 变量 和 实例 变量 不 同 ， 类 变量 在 使 用 前 必须 初始 化 。 


12.9.2 继承 
Ruby 定 义 子 类 采用 小 于 号 (<) ， 而 不 是 在 C++ 使 用 的 冒号 。 例 如 ， 


class MySubClass < BaseClass 

Ruby 方 法 访问 控制 的 一 个 不 同 之 处 在 于 通过 简单 调用 访问 控制 函数 能 在 子 类 中 改变 它们 ， 
这 意味 着 基 类 的 两 个 子 类 都 能 被 定义 ， 以 致 于 一 个 子 类 的 对 象 能 访问 基 类 定义 的 方法 ， 但 是 另 
一 个 子 类 的 对 象 却 不 能 。 这 也 允许 改变 基 类 中 公有 访问 方法 的 访问 为 子 类 的 私有 访问 方法 。 这 
种 子 类 明显 不 能 为 子 类 型 。 

回忆 第 11 章 讨论 过 的 Ruby 模 组 。 它 们 定义 了 一 种 经 常用 于 定 于 函数 库 的 命令 封装 。 然 而 ， 
也 许 模 组 最 有 趣 的 方面 是 能 从 类 直接 访问 它们 的 函数 。 在 类 中 访问 模 组 用 include 语 句 来 指定 ， 


(LA 


‘Nn 


Nn 
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例如 

inlude Math 

DA Ae BARR GS T RRI, HAARA SRE A, K 
际 上 ， 当 类 包含 了 模 组 时 ， 模 组 变 成 了 类 的 一 个 代理 超 类 。 这 种 模 组 称 为 混入 (mixin), AA 
它 的 函数 混入 了 类 中 定义 的 方法 。 混 入 提供 一 种 在 任何 需要 它 的 类 中 包含 模 组 功能 的 方法 。 当 
然 ， 类 仍然 有 一 个 正常 的 、 能 继承 成 员 的 超 类 。 因 此 ,混入 提供 了 多 继承 的 优点 ， 而 且 不 会 出 
现 如 采 模 组 在 它们 函数 中 不 需要 模 组 名 时 可 能 出 现 的 命令 冲突 。 


12.9.3 JERE 


Ruby 对 动态 绑 定 的 支持 与 Smalltalk 相 同 。 变 量 不 能 类 型 化 ， 它 们 都 是 对 任何 类 的 对 象 的 引 
用 。 因 此 ， 所 有 变量 都 是 多 态 的， 所 有 对 方法 调用 绑 定 都 是 动态 的 。 


12.9.4 评估 


因为 Ruby 是 最 纯 的 面向 对 象 程序 设计 语言 ， 所 以 它 对 面向 对 象 程序 设计 的 支持 是 彻底 的 。 
然而 ， 它 对 类 成 员 的 访问 控制 比 C++ 更 弱 。 它 也 不 支持 多 继承 。 最 后 ， 尽 管 混和 人 与 接口 紧 紧 相 
关联 ， 但 是 Ruby 不 支持 抽象 类 或 接口 。 


12.10 ” JavaScript 的 对 和 象 模型 


虽然 JavaScript 中 不 具有 类 ， 也 不 支持 继承 与 动态 绑 定 ， 但 它 使 用 一 个 松散 地 基于 C++ 和 
Java 的 对 象 模型 。JavaScript 的 设计 因此 成 为 使 用 语言 支持 对 象 的 传统 概念 的 一 种 有 趣 的 替代 。 


12.10.1 一 般 特 征 


JavaScript 原 本 是 由 Netscape 设 计 来 用 于 Web 服 务 器 的 程序 设计 的 脚本 语言 。 它 自 此 而 发 展 
并 演化 成 为 地 位 显著 的 语言 ， 它 补充 HTML 文 档 ， 用 来 提供 这 些 文 挡 的 计算 能 力 。JavaScript 也 
用 来 定义 动态 HTML 文 档 。 并 且 ， 在 表格 数据 送 往 Web 服 务 器 之 前 ，JavaScript 用 来 对 之 进行 验 
证 。 正 是 因为 这 一 点 ，JavaScript 才 成 为 了 一 种 流行 的 语言 。 

尽管 它 的 名 字 的 第 一 个 部 分 是 Java， 但 JavaScript 与 Java 却 没有 共同 点 。 然 而 ， 它 的 名 字 的 
后 面部 分 才 的 确 是 真 的 一 一 它 是 一 种 脚本 语言 。JavaScript 代码 的 片段 可 以 散布 于 HTML 文 档 中 
的 不 同位 置 。 当 浏览 器 在 文档 中 过 到 JavaScript 代 码 时 ， 代 码 即 刻 被 解释 。 

JavaScript 与 Java 的 相似 仅仅 在 于 它们 使 用 类 似 的 语法 ,但 它们 有 着 许多 根本 的 差别 。Java 
是 一 种 静态 类 型 的 面向 对 象 语言 ， 而 JavaScript 是 动态 类 型 的 并 且 不 是 面向 对 象 的 。JavaScript 中 
没有 类 ， 它 的 对 象 既 是 对 象 又 是 对 象 模 型 。 因 为 不 具有 类 ，JavaScript 就 不 能 够 支持 基于 类 的 继 
蒜 。 而 没有 基于 类 的 继承 ，JavaScript 就 不 能 够 支持 多 态 。 虽 然 JavaScript 有 对 象 ， 但 是 它们 与 面 
癌 对 象 语言 中 的 对 象 非常 不 同 。 

如 同 大 多 数 支 持 面向 对 象 程序 设计 语言 一 样 ，JavaScript 具 有 两 类 变量 ， 引 用 对 象 的 变量 和 
直接 存储 原始 类 型 值 的 变量 。 变 量 可 以 被 声明 ， 但 声明 不 蕴涵 类 型 。 当 每 一 次 给 一 个 变量 赋值 
时 ， 都 能 够 改变 它 的 类 型 ， 而 新 的 类 型 就 是 所 赋 的 值 的 类 型 。 可 以 使 用 任何 变量 来 存储 任何 原 
始 类 型 的 值 或 者 是 来 引用 任何 对 象 。 


12.10.2 JavaScript 对 象 


JavaScript 中 的 对 象 具有 一 系列 性 质 ， 这 些 性 质 对 应 于 Java 与 C++ 中 类 的 成 员 。 每 一 个 性 质 


或 者 是 一 个 数据 的 性 质 ， 或 者 是 一 个 方法 的 性 质 。 

JavaScript 的 对 象 无 论 是 内 部 还 是 外 部 都 很 像 Perl 中 的 散 列 〈 见 第 6 章 ) 。 每 一 个 对 象 都 是 一 
列 性 质 一 值 的 对 。 其 中 的 性 质 为 名 字 ， 而 值 则 是 数据 的 值 或 是 对 于 对 象 的 引用 ， 其 中 的 一 些 是 
方法 。 所 有 的 函数 与 方法 都 是 对 象 ， 并 且 都 是 通过 变量 来 引用 的 。 函 数 与 方法 之 则 的 唯一 差别 
是 ， 方 法 是 通过 对 象 的 性 质 来 引用 的 。 

如 同 Perl 中 的 散 列 ， 一 个 JavaScript 对 象 的 性 质 的 系列 是 动态 的 ， 即 在 任何 时 刻 ， 性 质 都 可 
以 被 增加 或 被 删除 。 这 使 得 它们 非 第 不 同 于 C++ 和 Java 这 样 的 语言 中 的 对 象 。 尽 管 在 任何 正式 的 
意义 上 对 象 并 不 具有 类 型 ， 每 一 个 对 象 都 以 它 的 性 质 系列 为 特征 。JavaScript 包 括 一 个 typeof 
操作 符 ， 它 对 任何 对 象 都 返回 字符 串 "object"。 


12.10.3 ”对象 的 创建 与 修改 


new 表 达 式 第 弟 被 用 来 创建 对 象 ， 对 象 的 创建 必须 包括 对 构造 器 方法 的 调用 。 被 new 表 达 
式 所 调用 的 构造 器 产生 刻画 新 对 象 的 性 质 。 在 面向 对 象 语言 中 ，new 操 作 符 产生 一 个 特定 对 象 ， 
这 意味 着 一 个 具有 类 型 及 一 组 特殊 成 员 的 对 象 。 在 这 种 语言 中 的 构造 器 将 成 员 初 始 化 ， 但 并 不 
创建 这 些 成 员 。 在 JavaScript 中 new 操 作 符 创建 一 个 空 的 对 象 ， 即 不 具有 性 质 的 对 象 。 构 造 器 创 
建 这 些 性 质 ， 并 将 这 些 性 质 初 始 化 。 

下 面 的 语句 使 用 预定 义 的 Object 对 象 的 构造 器 来 创建 一 个 对 象 ， 但 它 并 不 产生 性 质 : 


var my object = new Object(); 


现在 变量 my_object 引 用 这 个 新 的 对 象 。 下 面 进一步 讨论 构造 器 。 

一 个 对 象 的 属性 是 使 用 点 标记 法 来 访问 的 ， 其 中 的 第 一 个 字 是 对 象 名 称 ， 第 二 个 字 则 是 属 
性 名 称 。 属 性 实际 上 并 非 变量 。 它 们 是 进入 散 列 的 关键 字 ， 正 如 Perl 的 散 列 关键 字 一 样 ， 它 们 
目 身 并 不 具有 值 。 它 们 被 用 来 与 对 象 的 变量 一 起 访问 属性 的 值 。 因 为 属性 不 是 变量 ， 它 们 从 来 
不 需要 被 声明 。 

如 上 记述， 在 解释 期 间 的 任何 时 刻 ， 可 以 从 一 个 对 象 中 增加 或 者 删除 属性 。 通 过 给 一 个 属 
性 赋值 ， 从 而 来 创建 这 个 对 象 的 属性 。 考 虑 下 面 的 例子 : 


var my car = new Object(); // 产生 一 个 空 对 象 
my_car.make = "Ford"; // 产生 并 且 初 始 化 make 
my_car.model = "Contour SVT"; // 产生 并 且 初 始 化 model 


这 段 代 码 创 建 了 一 个 具有 两 个 属性 : make 与 mode1l 的 新 对 象 ny_car。 因 为 对 象 可 以 被 
芯 套 ， 所 以 我 们 能 够 创建 一 个 为 ny_car 的 属性 的 新 对 象 ， 这 个 对 象 自身 又 有 着 自己 的 一 些 属 


性 。 例 如 ， 
my_car.engine = new Object(); 
my car.engine.config = "V6"; 


my car.engine.hp = 200; 

如 果 企 图 访问 一 个 并 不 存在 的 对 象 的 属性 ， 则 使 用 undefined 的 值 。 使 用 delete 指 令 能 
够 删除 属性 。 例 如 ， 

delete my car.model; 

JavaScript 的 构造 器 是 一 些 特殊 的 方法 ， 它 们 为 新 的 对 象 创建 属性 ， 并 设 定 这 些 属性 的 初 值 。 
正如 前 面 讲述 的 ， 每 一 个 new 表 达 式 必须 包括 一 个 对 于 构造 器 的 调用 。 构 造 器 实际 上 由 new 操 
作 符 来 调用 的 ， 在 new 表 达 式 中 的 new 操 作 符 置 于 构造 器 名 称 之 前 。 
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构造 器 显然 必须 能 够 引用 它 所 操作 的 对 象 。JavaScript 为 此 目的 而 具有 名 为 this 的 预定 义 
的 引用 变量 。 当 调用 构造 器 时 ，this 是 对 于 新 创建 的 对 象 的 引用 。this 变 量 被 用 来 创建 对 象 
的 属性 ， 并 且 设 定 这 些 属性 的 初 值 。 例 如 ， 考 虑 下 面 的 构造 天: 

function car(new make, new model, new year) { 

this.make = new make; 
this.model = new model; 
this.year = new year; 

} 

这 个 构造 器 也 可 以 作 如 下 使 用 : 

my car = new car("Ford", "Contour SVT", "2000"); 

如 果 要 将 一 个 方法 包含 到 对 象 中 , 给 它 设 定 初 值 的 方式 就 与 给 数据 性 质 设 定 初 值 的 方式 相同 。 
例如 ， 假 设 我 们 为 显示 属性 值 的 car 对 象 创建 了 一 个 方法 ,命名 为 display_car。 通 过 给 构造 
器 增加 下 面 的 这 行 指 令 ，display_car 方 法 被 加 入 到 new 所 创建 对 象 以 及 构造 器 的 调用 之 中 : 

this.display = display car; 

JavaScript 中 唯一 的 与 面向 对 象 程序 设计 语言 中 的 类 相关 的 概念 是 对 象 种 类 的 概念 。 一 个 对 
象 种 类 是 通过 使 用 同一 个 构造 如 来 创建 的 一 组 对 象 。 所 有 这 样 的 对 象 都 具有 一 套 相 同 的 属性 和 
方法 ， 至 少 是 在 这 些 对 象 产 生 的 初期 。 然 而 ， 在 脚本 中 却 没 有 方便 的 办 法 来 确定 两 个 对 象 是 否 
有 具有 一 套 相 同 的 属性 与 方法 。 


12.10.4 评估 


就 语言 的 设计 目标 而 言 ，JavaScript 是 一 种 十 分 有 效 的 脚本 语言 。 如 果 是 被 设计 来 开发 大 规 
模 的 软件 系统 ， 它 的 对 象 模型 则 是 完全 不 够 用 的 。 由 于 没有 类 的 封装 功能 ， 在 JavaScript 中 不 
能 够 有 效 地 组 织 大 型 的 程序 。 没 有 继承 ， 复 用 将 会 十 分 困难 。 因 此 ， 虽 然 JavaScript 中 的 对 象 
模型 是 有 趣 的 ， 但 它 不 能 够 满足 促进 面向 对 象 程序 设 计 语 言 发 展 的 需要 。 


12.11 面 器 对 象 结构 的 实现 


在 支持 面 问 对 象 程 序 设 计 的 语言 中 ， 至 少 其 中 有 两 个 部 分 包含 了 语言 的 实现 人 员 所 感 兴 
的 问题 ， 即 实例 变量 的 存储 结构 以 及 消息 对 于 方法 的 动态 绑 定 。 在 这 一 节 中 ， 我 们 将 简略 地 探 
讨 这 两 个 同 题 。 


12.11.1 存储 实例 数据 


在 C++ 中 ， 将 类 定义 为 是 对 于 C 中 的 记录 结构 ( 即 struct) 的 一 些 扩展 。 它 们 之 间 的 这 种 相 
似 性 提示 我 们 ， 可 以 将 记录 结构 作为 类 实例 变量 的 存储 结构 。 我 们 称 这 种 形式 的 结构 为 类 实例 
记录 (class instance record, CIR)。CIR 的 结构 是 静态 的 ， 因 此 它 在 编译 时 被 建造 ， 并 且 被 用 来 
作为 产生 类 实例 的 模板 。 每 个 类 都 有 它 自 己 的 CIR。 当 派生 类 时 ， 子 类 的 CIR 是 父 类 的 拷贝 ， 新 
的 实例 变量 项 添加 到 末尾 。 

因为 CIR 的 结构 是 静态 的 , 可 以 使 用 从 CIR 实 例 开端 的 常量 偏 移 来 对 所 有 实例 变量 进行 访问 ， 
就 如 同 在 记录 中 的 那样 。 这 种 功能 使 得 这 些 访问 具有 与 在 记录 的 域 中 访问 一 样 的 高 效率 。 


12.11.2 消息 对 方法 的 动态 绑 定 
静态 绑 定 的 类 中 的 方法 并 不 需要 是 在 这 个 类 的 CIR 中 涉及 。 然 而 ， 动 态 绑 定 的 方法 必须 在 
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CIR 结 构 中 具有 入 口 。 这 种 入 口 可 以 仅仅 是 指向 方法 的 代码 的 一 个 指针 ， 必 须 将 它 设立 于 创建 
对 象 之 时 。 然 后 对 于 方法 的 调用 就 可 以 通过 这 个 CIR 中 的 指针 连接 到 相对 应 的 代码 之 上 。 这 种 
技术 的 缺点 是 ， 每 一 个 实例 都 需要 存储 指向 可 能 从 这 个 实例 调用 的 所 有 动态 绑 定 方法 的 指针 。 

注意 ， 可 以 从 类 的 一 个 实例 来 调用 的 动态 绑 定 方法 对 于 这 个 类 的 所 有 实例 都 是 相同 的 。 因 
此 ， 只 应 该 将 这 些 方法 的 表 存储 一 次 。 因 而 CIR 只 需要 一 个 指针 来 指向 这 个 表 ， 使 得 能 够 找到 
被 调用 的 方法 。 有 时 将 这 个 表 的 存储 结构 称 为 虚拟 方法 表格 (virtual method table， 简 称 为 
vtable) 。 可 以 使 用 VMT 中 的 偏 移 来 表示 方法 的 调用 。 一 个 祖先 类 的 多 态 变量 总 是 能 够 引用 正 
确 类 型 对 象 的 CIR ， 从 而 确保 了 能 够 得 到 动态 绑 定 方法 的 正确 版 本 。 考 虑 下 面 的 Java 示 例 ,， # Ba] 
中 的 所 有 方法 都 被 假设 为 动态 绑 定 的 ; 

public class A { 

public int a, b; 


public void draw() { ... } 
public int area() { ... } 


public class B extends A { 
public int cy ds 
public void draw() { ... } 
public void sift() { ... } 
} 


图 12-2 显 示 了 类 A 与 类 B 的 CIR 以 及 它们 的 vtables。 注 意 ， 在 B 的 vtable 中 area 方 法 的 方 
法 指针 指向 A 的 area 方 法 的 代码 。 因 为 B 没 有 覆盖 A 的 area 方 法 ， 所 以 如 果 B 的 客户 端 调用 
area，area 方 法 是 从 A 继 承 的 。 另 一 方面 ， 在 B 的 Vtable 中 draw 和 sift 的 指针 指向 B 的 draw 
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图 12-2 一 个 具有 单 继承 的 CIR 的 例子 
假设 一 个 被 命名 为 C 的 类 产生 类 A 与 类 B 的 对 象 ， 并 具有 两 个 被 分 别 命名 为 aobj 和 bobj 的 
5 引用。 进一步 地 假设 ， 在 类 c 中 存在 着 赋值 ; 


aObj = bObj; 

现在 又 存在 一 个 调用 . 

aObj.draw(); 

而 且 前 面 的 赋值 语句 仅仅 是 将 b0bj 的 指针 复制 到 a0bj 上， 可 以 调用 A 的 draw 方 法 ， 然而 
却 是 不 正确 的 。 这 个 例子 说 明了 ， 将 引用 bobj 赋 给 aobj 是 有 副作用 的 ， 它 将 aobj 的 vtable 


指针 改 为 指向 B 类 的 vtable 指 针 。 
多 继承 将 动态 绑 定 的 实现 复杂 化 。 考 虑 下 面 的 三 个 C++ 类 的 定义 : 


class A { 
public: 
int a; 
virtual void fun() { ... } 
virtual void init() { --- } 
class B { 
public: 
int b; 
virtual void sum() { ... } 
}; 
class C : public A, public B { 


public: 
int C; 
virtual void fun() { --- } 
virtual void dud() { ... } 


}; 


米 c 从 类 A 那里 继承 了 变量 a 以 及 方法 init。 类 C 重 新 定义 了 方法 fun， 虽 然 类 C 中 的 fun 及 
其 父 类 A 中 的 fun 通 过 一 个 (类 型 A 的 ) 多 态 变量 都 有 可 能 是 可 见 的 。 类 C 从 类 B 那 里 继承 了 变量 
b 以 及 方法 sum。 类 Cc 定 义 了 自己 的 变量 c， 并 且 还 定义 了 一 个 非 继承 的 方法 aud。 类 Cc 的 一 个 
CIR 必 须 包 括 类 A 的 数据 、 类 B 的 数据 、 类 c 的 数据 以 及 访问 所 有 方法 的 一 些 方式 。 在 单 继 承 的 情 
MF, CR 包含 一 个 指向 vtable 的 指针 ，vtable 存 有 所 有 可 见方 法 的 代码 的 地 址 。 然 而 ， 在 多 继 
承 的 情况 下 ， 事 情 就 没 那么 简单 。CIR 中 包括 至 少 两 个 不 同 的 影像 ， 每 个 影像 存放 一 个 父 类 的 
信息 。 而 两 个 影像 之 一 又 存放 子 类 c 的 影像 。 与 单 继承 的 情况 相同 ， 在 存放 父 类 信息 的 影像 中 
存放 子 类 的 影像 。 

必须 有 两 个 vtable: 一 个 存放 A 和 Cc 的 影像 ， 另 一 个 存放 B 的 影像 。 在 这 种 情况 下 ，C 的 CIR 的 
第 一 部 分 可 以 是 C 和 A 的 影像 部 分 ， 其 起 始 处 是 一 个 vtable 的 指针 ， 指 向 Cc 的 方法 和 从 A 继承 的 方 
法 ， 并 包括 从 A 继承 的 数据 。 在 Cc 的 CIR 中 紧 接着 的 是 B 的 影像 部 分 ， 其 起 始 处 是 一 个 vtable 的 指 
针 ， 指 向 B 的 虚拟 方法 ， 再 接着 是 从 B 继 承 的 数据 和 c 中 定义 的 数据 。 图 12-3 显 示 了 类 C 的 CIR。 


(Cc 与 A 部 分 ) 的 C 的 vtable 
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图 12-3 一 个 具有 多 父 类 的 子 类 CIR 的 示例 
小 结 


面向 对 象 程序 设计 包括 了 三 个 基本 概念 : 抽象 数据 类 型 ， 继 承 和 动态 绑 定 。 面 向 对 象 程序 设计 语言 
通过 类 、 方 法 、 对 象 和 消息 传递 ， 来 支持 面向 对 象 程序 设计 范式 。 

在 这 一 章 中 关于 面向 对 象 程序 设计 语言 的 讨论 ， 围 绕 着 七 个 设计 间 题 ， 纯 对 象 、 子 类 与 子 类 型 、 类 
型 检测 及 对 象 的 多 态 、 单 继承 与 多 继承 、 动 态 绑 定 、 对 象 的 显 式 与 隐 式 解除 引用 RRB. 

Smalltalk 是 一 种 纯 面 向 对 象 语言 一 一 其 中 的 每 一 个 事物 都 是 一 个 对 象 ， 所 有 计算 都 通过 消息 传递 来 完 


成 。 在 Smalltalk 中 的 所 有 子 类 都 是 子 类 型 。 所 有 的 类 型 检测 以 及 消息 对 于 方法 的 绑 定 都 是 动态 的 ， 而 且 所 
有 的 继承 都 是 单 继承 。Smalltalk 没有 显 式 解除 分 配 的 操作 。 

C++ 提 供 了 对 于 数据 抽象 、 继 承 ， 消 息 对 方法 的 选择 性 的 动态 绑 定 ， 以 及 C 的 所 有 传统 特性 的 支持 。 
这 总 味 着 它 具 有 两 个 不 同 的 类 型 系统 。 尽 管 Smalltalk 的 动态 绑 定 ， 给 程序 设计 提供 了 比 混合 式 语言 C++ 更 
多 的 灵活 性 ， 但 Smalltalk 的 效率 却 要 差 得 多 。C++ 提供 多 继承 以 及 对 象 的 显 式 解除 分 配 。C++ 包 括 了 多 种 
对 于 类 中 实体 的 访问 控制 ， 其 中 的 一 些 可 以 避免 子 类 成 为 子 类 型 。 构 造 器 与 析 构 器 方法 都 可 以 包括 在 类 
中 ， 这 两 种 方法 都 被 隐 式 地 调用 。 

Java 不 是 像 C++ 那 样 的 混合 式 语言 ， 它 是 专门 用 来 支持 面向 对 象 程序 设计 的 。 然 而 与 C++ 一 样 ，Java 
具有 原始 数量 的 类 型 与 类 。 所 有 对 象 都 从 堆 来 分 配 ， 并 通过 引用 变量 而 被 访问 。Java 没 有 显 式 的 对 象 解除 
分 配 的 操作 。Java 中 的 唯一 的 子 程序 就 是 方法 ， 只 能 通过 对 象 或 类 来 调用 这 些 方 法 。 尽 管 通过 接口 的 使 用 ， 
多 继承 也 是 可 能 的 ， 但 Java 只 是 直接 支持 单 继承 。 除 了 不 能 够 被 覆盖 的 方法 以 外 ， 所 有 消息 对 于 方法 的 绑 
定 都 是 动态 的 。 除 了 类 以 外 ，Java 还 包括 了 包 来 作为 第 二 种 封装 结构 ， 

Ada 95 通 过 标志 类 型 提供 了 对 于 面向 对 象 程序 设计 的 支持 ， 标 志 类 型 可 以 使 用 继承 。 通 过 使 用 类 

邯 围 类 型 ， 动 态 绑 定 成 为 可 能 。 派 生 类 型 扩展 到 了 父 类 型 ， 除 非 这 些 派 生 类 型 是 被 定义 于 子 库 包 之 中 。 
而 在 后 面 这 一 类 情形 之 下 ， 可 以 从 派生 类 型 中 将 父 类 型 的 实体 删除 掉 。 在 子 库 包 以 外 ， 所 有 子 类 都 是 子 
类 型 。 
j 基于 C++ 和 Java 的 C# 支 持 面向 对 象 的 程序 设计 。 对 象 可 以 从 类 或 结构 来 施行 实例 化 。 结 构 对 象 是 栈 动 
态 的 ， 并 且 不 支持 继承 。 通 过 在 父 类 藏匿 的 名 称 里 包括 base， 派 生 类 中 的 方法 就 可 以 定义 父 类 的 这 种 方 
法 。 可 以 被 覆盖 的 方法 必须 标记 上 viztual ， 以 及 覆盖 方法 则 必须 标记 上 override。 所 有 的 类 ， 还 有 所 
有 的 基本 类 型 ， 都 派生 自 Object。 

Ruby 征 一 种 脚本 语言 ， 其 所 有 数据 都 是 对 象 。 正 如 Smalltalk， 所 有 对 象 都 是 堆 分 配 的 ， 所 有 变量 都 
征 对 对 象 的 无 类 型 的 引用 。 所 有 构造 器 命令 为 initialize。 所 有 实例 数据 都 是 私有 的 ， 但 可 以 有 容易 包 
括 获 取 和 设置 方法 。 已 经 提供 的 访问 方法 的 所 有 实例 变量 形成 对 类 的 公有 接口 。 这 种 实例 方法 称 为 属性 。 
Ruby 类 起动 态 的， 这 意味 着 它们 是 可 执行 的 和 在 任何 时 期 是 可 改变 的 。Ruby 只 支持 单 继承 ， 其 子 类 不 必 
为 子 类 型 。 

Javascript 虽 然 不 是 一 种 面向 对 象 的 语言 ， 但 它 包 括 了 对 象 概念 上 的 一 种 有 趣 的 变 体 。 方 法 调用 对 于 
方法 的 动态 绑 定 ， 可 以 使 用 类 实例 记录 和 方法 地 址 的 虚拟 表格 来 实现 。 这 种 方式 还 可 以 被 扩展 ， 以 便 包 括 
对 于 多 继承 的 支持 。 


复习 题 


1. 描述 面向 对 象 语言 三 个 特性 。 

2. 类 变量 与 实例 变量 之 间 的 差别 是 什么 ? 

3. 什么 是 覆盖 方法 ? 

4. 摘 述 一 种 动态 绑 定 是 极为 重要 的 情形 。 

5. 什么 是 虚拟 方法 ? 

6. 简略 描述 本 章 讨论 的 面向 对 象 语言 的 六 个 设计 问题 。 

7. 什么 是 方法 的 消息 协议 ? 

8. 为 什么 Smalltalk 的 类 能 够 响应 消息 ? | 

9. 解释 Smalltalk 的 消息 是 怎样 绑 定 于 方法 的 。 这 种 绑 定 何 时 发 后 ? 
10. Smalltalk 中 进行 什么 样 的 类 型 检测 ? 何 时 进行 ? 

11. Smalltalk 支 持 什么 类 型 的 继承 ， 单 继承 还 是 多 继承 ? 

12. Smalltalk 对 计算 有 哪 两 种 重要 的 影响 ? 

13. 所 有 Smalltalk 的 变量 实质 上 都 是 一 个 类 型 。 这 个 类 型 是 什么 ? 
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14. C++ 中 的 对 象 可 以 在 哪里 被 分 配 ? 

15. C++ 中 堆 分 配 的 对 象 是 怎样 被 解除 分 配 的 ? 

16. 所 有 C++ 中 的 子 类 都 是 于 类 型 吗 ? 

17. 在 什么 情况 下 一 个 C++ 的 方法 调用 可 以 静态 地 绑 定 于 一 个 方法 ? 

18. 允许 设计 人 员 来 说 明 哪 一 个 方法 能 够 被 静态 地 绑 定 有 什么 缺点 ? 

19. 解释 在 C++ 中 关于 Private 的 两 种 用 法 之 间 的 差别 。 

20. 什么 是 C++ 中 的 Erziend 国 数 ? 

21. Java 的 类 型 系统 与 C++ 的 有 什么 不 同 ? 

22. Java 的 对 象 可 以 在 哪里 被 分 配 ? 

23. 怎样 将 Java 的 对 象 解 除 分 配 ? 

24. 所 有 Java 的 子 类 都 是 子 类 型 吗 ? 

25. 在 什么 情况 下 一 个 Java 的 方法 调用 可 以 静态 地 绑 定 于 一 个 方法 ? 

26. C# 中 的 覆盖 方法 怎样 在 语法 上 不 同 于 C++ 中 的 覆盖 方法 ? 

27. 在 C# 中 ， 当 一 个 子 类 覆盖 了 从 父 类 继承 的 一 个 方法 时 ， 怎 样 从 子 类 中 调用 这 个 方法 在 父 类 中 的 
版 本 ? | 

28. 所 有 Ada 95 的 子 类 都 是 子 类 型 吗 ? 

29. 如 何 说 明 Ada 95 中 对 一 个 子 程序 的 调用 是 动态 地 绑 定 到 一 个 子 程序 的 定义 ? 这 个 决定 是 在 何 时 作 
出 的 ? 

30. Ruby 如 何 实 现 基 本 类 型 ， 如 整 型 和 浮 点 型 数据 ? 

31. Ruby 类 如 何 定义 获取 方法 ? 

32. Ruby 支 持 实例 变量 的 什么 访问 控制 ? 

33. Ruby 支 持 方法 的 什么 访问 控制 ? 

34. 所 有 Ruby 子 类 都 是 子 类 型 吗 ? 

35. Ruby 支 持 多 继承 吗 ? 

36. 在 哪些 基本 的 方面 ，JavaScript 对 象 不 同 于 Java 对 象 ? 

37. JavaScript #Jie at Fl Java 构造 器 之 间 的 主要 不 同 是 什么 ? 


练习 题 


1. 比较 C++ 和 Java 中 的 动态 绑 定 。 
2. 比较 C++ 和 Java 中 的 类 实体 的 访问 控制 。 
3. 比较 C++ 和 Ada 95 中 的 类 实体 的 访问 控制 。 
4. 比较 C++ 中 的 多 重 继承 和 Java 中 由 接口 所 提供 的 多 重 继承 。 
5. 比较 GJ (generic Java) 和 C++ 中 的 通用 功能 。 
6. 在 什么 程序 设计 情况 下 ， 多 重 继承 比 单 继承 好 得 多 ? 
7. 抽象 数据 类 型 的 哪 两 个 问题 被 继承 所 改善 ? 
8. 描述 一 个 子 类 型 可 以 对 其 父 类 作 哪 些 改变 ? 
9. 解释 继承 的 一 个 缺点 。 
10. 解释 一 种 语言 中 所 有 的 值 都 是 对 象 的 优点 和 缺点 。 
11. 当 一 个 子 类 与 其 父 类 有 is-a 关 系 时 ， 这 意味 着 什么 ? 
12. 一 个 覆盖 方法 的 参数 应 与 被 覆盖 方法 的 参数 多 紧密 地 匹配 ? 
13. 明显 地 ，Java 的 设计 者 认为 由 静态 方法 绑 定 所 来 提高 效率 是 不 值得 的 。 谈 谈 支持 和 反对 Java 的 这 个 设计 
的 理由 。 
14. Java 的 所 有 对 象 都 由 一 个 共同 的 祖先 。 这 样 做 的 理由 是 什么 ? 


15. Java 中 的 Einalize 子 句 的 目的 是 什么 ? 

16. 如 果 Java 中 既 人 允许 栈 动 态 对 象 ， 又 允许 堆 动态 对 象 ， 会 得 到 什么 好 处 ? 又 会 有 什么 缺点 ? 

17. 从 程序 设计 方便 性 的 角度 ， 比 较 Ada95 和 C++ 提供 多 态 的 方式 。 

18. 研究 并 解释 为 什么 C# 不 包括 非 静态 藤 套 类 。 

19. 你 能 为 一 个 抽象 类 定义 引用 变量 吗 ? 这样 的 变量 有 什么 用 ? 

20. 比较 Java 和 Ruby 中 的 实例 变量 的 访问 控制 。 

21. 比较 Java 和 Ruby 中 的 实例 变量 的 类 型 错误 检测 |。 

程序 设计 练习 题 

1. 用 Java 改 写 12.5.2 小 节 中 的 single linked list, stack 2 和 queue 2 类 。 并 在 可 读 性 和 程序 设计 容 
易 性 方面 与 这 些 类 的 C++ 版 本 进行 比较 。 

2. 用 Ada 95 重 做 第 1 题 。 

3. 用 Ruby 重 做 第 1 题 。 

4. 设计 和 实现 基 类 A 定义 的 程序 ，A 有 子 类 B，B 有 子 类 C。A 类 必须 实现 一 个 方法 ,该 方法 在 B 和 C 中 被 覆 
盖 。 编 写 一 个 测试 类 ， 以 实例 化 A、B 和 C， 以 及 包括 3 个 对 方法 的 调用 。 一 个 调用 必须 静态 绑 定 到 A 方 
法 ， 一 个 调用 必须 动态 绑 定 到 B 方 法 ， 一 个 方法 动态 绑 定 到 C 方 法 。 所 有 的 方法 调用 必须 使 用 指向 类 A 
的 指针 。 


第 13 章 并 发 


本 章 首 先 将 描述 子 程序 〈 或 单位 ) 层次 和 语句 层次 上 的 各 种 并 发 ， 也 将 简略 地 描述 一 些 常 
见 种 类 的 多 处 理 器 计算 机 的 体系 结构 。 然 后 ， 我 们 将 较 详 细 地 讨论 程序 单位 层次 上 的 并 发 。 我 
们 先 描述 一 些 在 讨论 单位 层次 上 的 并 发 之 前 所 必须 理解 的 基本 概念 ， 包 括 竞 争 同步 和 合作 同步 。 
接 下 来 ， 我 们 将 描述 为 并 发 提供 语言 支持 的 设计 间 题 。 然 后 我 们 将 详细 地 讨论 ， 语 言 中 支持 并 
发 的 三 种 主要 的 方法 : 信号 量 、 管 程 和 消息 传递 。 我 们 也 将 给 出 程序 示例 。 使 用 一 个 虚拟 代码 
示例 程序 来 示范 信号 量 的 使 用 方法 ， 使 用 一 个 用 并 发 Pascal 所 编写 的 示例 程序 来 说 明 管 程 的 使 
用 ， 使 用 一 个 Ada 的 程序 来 作为 消息 传递 的 例子 。Ada 支 持 并 发 的 一 些 语 言 特性 也 将 被 详细 描述 。 
这 些 特 性 包括 任务 、 受 保护 的 对 象 (在 效果 上 就 是 管 程 ) 和 异步 消息 传递 。 然 后 我 们 将 讨论 ， 
Java 和 C# 在 程序 单位 层次 上 对 于 并 发 的 支持 。 本 章 的 最 后 一 节 讨 论语 名 层次 上 的 并 发 ， 包 括 高 
性 能 的 Fortran 对 于 并 发 的 支持 。 


13.1 概述 


软件 执行 时 的 并 发 表现 为 4 个 层次 : 指令 层次 (同时 运行 两 条 或 更 多 的 机 器 指令 )、 语 句 层 
次 (同时 运行 两 条 或 更 多 的 语句 )、 单 位 层次 (同时 运行 两 个 或 更 多 的 子 程序 单位 ) 和 程序 层次 
(同时 运行 两 个 或 更 多 的 程序 ) 。 因 为 指令 层次 和 程序 层次 的 并 发 不 涉及 语言 的 问题 ， 本 章 将 不 
进行 讨论 。 我 们 将 讨论 子 程序 层次 上 和 语句 层次 上 的 并 发 ， 并 将 重点 放 在 子 程序 层次 上 的 并 发 。 

程序 单位 上 的 并 发 执行 ， 可 以 进行 在 一 些 物理 上 分 开 的 处 理 器 上 ， 也 可 以 在 共享 单 处 理 器 
的 情况 下 逻辑 地 进行 。 这 似乎 是 一 个 简单 的 概念 ， 但 是 它 对 于 程序 设计 语言 的 设计 人 员 ， 却 是 
一 个 重大 的 挑战 。 

并 发 控制 方法 增加 了 程序 设计 的 灵活 性 。 它 们 本 来 被 发 明 来 解决 操作 系统 方面 的 问题 ， 但 
后 来 被 用 到 多 种 其 他 程序 设计 应 用 中 。 例 如 ， 许 多 被 设计 来 模拟 实际 的 物理 系统 的 软件 系统 ， 
许多 这 些 实际 的 物理 系统 ， 是 由 多 个 并 行 的 子 系统 所 组 成 的 。 对 于 这 些 应 用 ， 传 统 的 子 程序 控 
制 的 受 限 形式 是 不 适用 的 。 

语句 层次 的 并 发 与 程序 单位 层次 的 并 发 有 很 大 不 同 。 从 语言 设计 者 的 角度 来 看 ， 语 句 层次 
的 并 发 主要 是 说 明 数 据 应 该 如 何 分 布 到 多 个 存储 器 中 ， 以 及 哪些 语句 应 该 被 并 行 地 执行 。 

本 章 的 意图 ， 是 要 讨论 并 发 与 语言 设计 问题 最 相关 的 方面 ， 而 不 是 对 于 并 发 中 的 所 有 问题 
作出 一 项 权威 性 的 研究 。 那 样 的 研究 对 于 一 本 程序 设计 语言 的 书 是 不 适合 的 。 


13.1.1 多 处 理 器 体系 结构 


很 多 不 同 计算 机 体系 结构 有 一 个 以 上 的 处 理 器 ， 并 且 能 够 支持 某 些 形 式 的 并 发 执行 。 在 开 
始 讨论 各 种 程序 和 语句 的 并 发 执行 之 前 ， 我 们 先 简略 地 描述 多 处 理 器 的 体系 结构 。 

第 一 批 具 有 多 处 理 器 的 计算 机 是 一 个 通用 的 处 理 器 ， 加 上 一 个 或 多 个 仅 用 于 输入 和 输出 操 
作 的 处 理 器 〈 外 设 处 理 器 )。 这 样 的 体系 结构 允许 那些 在 20 世 纪 50 年 代 后 期 出 现 的 计算 机 ， 在 执 
行 一 个 程序 的 同时 ， 并 行 地 执行 其 他 程序 的 输入 或 输出 。 因 为 这 种 并 发 不 需要 语言 的 支持 ， 我 
们 将 不 再 在 本 书 中 进行 考虑 。 
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到 20 世 纪 60 年 代 早期 , 就 有 了 具有 多 个 完整 处 理 器 的 机 器 。 这 些 处 理 器 通过 操作 系统 的 作 
业 调 度 程序 来 使 用 ， 操 作 系 统 的 作业 调度 程序 将 批量 作业 队列 中 那些 分 开 的 作业 分 配 到 不 同 的 
处 理 器 。 具 有 这 种 结构 的 系统 支持 了 程序 层次 的 并 发 。 

在 20 世 纪 60 年 代 中 期 ， 出 现 了 新 的 多 处 理 器 计算 机 。 多 处 理 器 计算 机 的 处 理 器 是 完全 相同 
的 ， 它 们 还 可 以 分 别 执行 一 个 指令 流 中 的 不 同 指令 。 例 如 ， 有 些 机 器 具有 两 个 或 多 个 浮 点 数 的 
乘法 器 ， 还 有 些 机 器 具有 两 个 或 多 个 完整 的 浮 点 数 算术 单元 。 需 要 由 为 这 些 机 器 所 编写 的 编译 
器 来 决定 哪些 指令 可 以 被 并 行 地 执行 ， 以 便 对 这 些 指令 进行 相应 的 调度 。 具 有 这 种 结构 的 系统 
支持 指令 层次 的 并 发 。 

现在 有 许多 不 同类 型 的 多 处 理 器 计算 机 ， 下 面 我 们 将 描述 其 中 最 常用 的 两 种 。 

在 不 同 的 数据 上 同时 运行 相同 指令 的 多 处 理 器 计算 机 被 称 为 “ 单 指令 多 数据 ”(SIMD) fk 
系 结构 的 计算 机 。 在 一 部 SIMD 结构 的 计算 机 中 ， 每 个 处 理 器 都 有 自己 的 局 部 存储 器 。 由 一 个 
处 理 器 来 控制 其 他 处 理 器 的 操作 。 因 为 除了 控制 器 之 外 的 所 有 处 理 器 ， 都 在 同一 时 刻 执行 相同 
的 指令 ， 然 而 在 软件 中 并 不 需要 同步 。 也 许 最 广泛 使 用 的 SIMD 机 器 是 一 类 被 称 为 矢量 处 理 器 的 
计算 机 。 这 种 计算 机 具有 多 组 寄存 器 ， 来 存储 矢量 操作 的 操作 数 ， 而 相同 的 指令 同时 在 这 些 操 
作 数 上 运行 。 从 这 种 体系 结构 获 益 最 大 的 ， 是 科学 计算 程序 ， 科 学 计算 通常 就 是 多 处 理 器 计算 
机 的 设计 目标 。 

具有 独立 地 操作 能 力 ， 并 且 这 些 操作 能 够 被 同步 的 多 处 理 器 计算 机 称 为 多 指令 多 数据 
(MIMD) 的 计算 机 。 在 一 部 MIMD 计 算 机 中 ， 每 个 处 理 器 都 执行 自己 的 指令 流 。MIMD 计 算 机 
具有 两 种 不 同 的 配置 结构 ， 即 分 布 式 系统 与 共享 存储 系统 。 在 分 布 式 的 MIMD 机 器 中 ， 每 一 个 
处 理 如 都 有 自己 的 存储 器 。 一 台 分 布 式 MIMD 机 器 能 够 被 装 入 一 个 盒子 之 中 ,或 者 是 可 以 被 分 
布 在 一 个 大 的 区 域 之 中 。 共 享 存储 的 MIMD 机 器 则 显然 必须 提供 一 些 同步 方法 来 避免 存储 访问 
则 的 冲突 。 其 至 分 布 式 的 MIMD 机 器 也 需要 同步 ， 以 便 同 时 操作 于 同一 程序 之 上 。MIMD 计 算 
机 比 SIMD 计 算 机 更 加 昂贵 也 更 加 通用 ， 显 然 MIMD 计 算 机 都 支持 单位 层次 的 并 发 。 


13.1.2 并 发 的 种 类 


存在 着 两 种 并 发 单位 的 控制 。 最 普通 的 一 种 是 假设 存在 着 多 个 处 理 器 可 供 使 用 ， 并 且 来 自 
相同 程序 的 几 个 程序 单位 同时 地 运行 ， 这 就 是 物理 并 发 (physical concurrency), 一 种 稍微 放宽 
的 并 发 概念 是 允许 程序 员 和 应 用 软件 假设 : 存在 着 多 个 处 理 器 提供 真实 的 并 发 ， 然而 事实 上 ， 
程序 是 在 单 处 理 器 上 被 分 时 地 执行 。 这 种 形式 被 称 为 逻辑 并 发 (logical concurrency)。 这 种 情形 
类 似 于 多 道 程序 设计 的 计算 机 系统 向 不 同 用 户 提供 同时 执行 时 ， 所 给 人 的 错觉 从 程序 人 员 以 
及 语言 设计 人 员 的 观点 来 看 ， 罗 辑 并 发 与 物理 并 发 是 相同 的 。 将 逻辑 并 发 映射 到 执行 操作 的 硬 
件 上 去 将 是 语言 实现 人 员 的 工作 。 逻辑 和 物理 的 并 发 都 允许 将 并 发 的 概念 作为 程序 设计 方法 学 
来 使 用 。 在 本 章 后 面 的 几 节 里 ， 我 们 将 讨论 应 用 物理 并 发 和 人 逻辑 并 发 。 

一 种 有 用 的 可 视 化 程序 执行 流程 的 方法 是 ， 设 想 在 程序 源 文本 的 语句 上 放置 一 条 线 。 到 达 某 
个 特定 执行 点 的 每 条 语句 都 被 表示 该 执行 的 线 所 覆盖 。 跟随 经 过 源 程序 的 线 就 可 以 追踪 经 过 程序 
可 执行 版 本 的 执行 流程 。 当 然 ， 除 了 那些 最 简单 的 程序 以 外 ， 几乎 所 有 程序 中 的 这 种 线 都 是 非常 
复杂 的 。 程 序 中 的 控制 线 (thread of control) 就 是 控制 经 过 程序 时 到 达 程 序 中 之 点 的 序列 。 

上 共有 协同 (参见 第 9 章 ) 的 程序 有 时 被 称 为 准 并 发 。 这 种 程序 有 一 条 控制 线 。 在 物理 并 发 执 
行 的 程序 中 有 多 条 控制 线 。 每 一 个 处 理 器 能 够 执行 其 中 的 一 条 控制 线 。 虽然 逻辑 并 发 程序 的 执 
行 实 际 上 只 有 一 条 控制 线 ， 但 是 对 于 这 样 的 程序 进行 设计 和 分 析 时 ， 可 以 设想 它们 具有 多 条 控 
制 线 。 当 多 条 控制 线 的 程序 运行 于 单 处 理 器 的 机 器 上 时 ， 它 的 控制 线 被 映射 到 一 条 线 上。 在 这 
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种 情况 下 ， 它 就 变 成 了 虚拟 多 控制 线 的 程序 。 


语句 层次 的 并 发 是 一 个 相对 简单 的 概念 。 可 以 将 包括 数组 元 素 操作 语句 的 循环 拆 开 ， 以 便 
处 理 操作 能 够 被 分 配 到 多 个 处 理 右 上 。 例 如 ， 如 果 一 个 循环 重复 运行 500 次 ， 这 个 循环 包括 了 一 
条 语句 ， 一 次 操作 500 个 数组 元 素 中 的 一 个 ， 可 以 将 这 个 循环 拆 开 并 分 配 到 10 个 不 同 的 处 理 器 上 
同时 处 理 ， 从 而 一 个 处 理 器 将 处 理 50 个 数组 元 素 。 


13.1.3 学 习 并 发 的 动机 


学 习 并 发 的 第 一 个 理由 , 是 因为 并 发 提供 了 将 一 些 问题 的 程序 解决 办 法 概念 化 的 一 种 方法 。 
如 同人 递归 古 解 决 茶 一 类 问题 的 自然 方法 一 样 ， 许 多 问题 可 以 很 自然 地 使 用 并 发 来 解决 。 许 多 程 
序 被 编写 来 模拟 实际 实体 和 行为 。 在 许多 情况 下 ， 被 模拟 的 系统 包括 了 多 于 一 个 的 实体 ， 而 且 
这 些 实体 都 同时 在 进行 自己 的 活动 ， 例如， 在 一 个 控制 区 域 中 正在 飞行 的 飞机 、 一 个 通信 网 络 
中 的 中 继 站 和 一 个 制造 设备 中 的 不 同 机 器 。 为 了 使 用 软件 来 准确 地 模拟 这 样 的 系统 ， 软 件 就 必 
须要 能 够 处 理 并 发 。 

讨论 并 发 的 第 二 个 理由 ， 是 因为 当前 已 经 广泛 地 使 用 了 多 处 理 器 的 计算 机 ， 需 要 有 能 够 有 
效 利 用 这 种 硬件 功能 的 软件 。 因 为 语句 层次 和 单位 层次 并 发 的 重要 性 ， 因 而 必须 开发 提供 这 两 
种 并 发 的 设施 ， 并 且 必 须 将 这 种 设施 包括 进 当 代 程 序 设计 语言 。 


13.2 子 程序 层次 并 发 的 介绍 


在 我 们 讨论 对 于 并 发 的 语言 支持 之 前 ， 我 们 需要 介绍 关于 并 发 的 一 些 基础 概念 ， 以 及 能 够 
使 并 发 变 得 十 分 有 用 的 一 些 要 求 。 然 后 ， 我 们 再 讨论 支持 并 发 的 语言 的 语言 设计 问题 。 


13.2.1 基本 概念 


任务 (task) 是 一 个 可 以 与 同一 程序 的 其 他 单位 一 起 被 并 发 执行 的 程序 单位 (类 似 于 子 程序 )。 
程序 中 的 每 一 个 任务 提供 一 条 控制 线 。 有 了 时 也 将 任务 称 为 进程 (process), 

任务 具有 的 三 个 特征 能 够 用 来 与 子 程序 相 区 别 。 首 先 ， 任 务 可 以 被 隐 式 地 启动 ， 而 子 程 序 
则 必须 被 显 式 地 调用 。 其 次 ， 当 一 个 程序 单位 调用 一 个 任务 时 ， 它 在 继续 自己 的 工作 之 前 并 不 
需要 等 待 任务 执行 的 完成 。 最 后 ， 当 完成 一 个 任务 的 执行 时 ， 控 制 可 能 会 也 可 能 不 会 返回 到 启 
动 任务 执行 的 程序 单位 。 

可 以 将 任务 分 为 两 种 : 重任 务 (heavyweight task) 与 轻 任务 (lightweight task)。 简 而 言 之 ， 
一 个 重任 务 在 自己 的 地 址 空间 中 执行 ， 而 所 有 轻 任务 都 在 同一 地 址 空间 中 执行 。 实 现 轻 任务 比 
重任 务 要 容易 

任务 可 以 通过 共享 非 局 部 变量 、 消 息 传递 或 是 参数 ， 来 与 其 他 的 任务 进行 通讯 。 如 果 一 个 
任务 不 以 任何 方式 与 程序 中 的 其 他 任务 施行 通讯 ， 或 者 是 它 不 影响 任何 其 他 任务 的 执行 ， 我 们 
束 称 这 个 任务 是 不 相关 的 (disjoint)。 因 为 多 个 任务 常常 一 起 工作 来 产生 一 些 模 拟 或 者 是 解决 一 
些 问题 ， 因 而 它们 是 相关 的 ， 并 且 它 们 必须 使 用 某 种 通讯 的 方式 来 同步 彼此 的 执行 或 者 共享 数 
据 ， 或 者 是 这 两 种 方式 皆 而 有 之 。 

FIZ (synchronization) 是 一 种 控制 任务 执行 顺序 的 机 制 。 当 一 些 任务 共享 数据 时 ， 需 要 看 
两 种 类 型 的 同步 : 即 合作 同 步 与 竞争 同步 。 当 任务 A 在 继续 它 的 执行 之 前 ， 如 果 它 必须 等 等 伍 
务 B 完 成 某 种 特定 活动 ， 在 任务 A 与 任务 B 之 间 就 需要 合作 同步 (cooperation synchronization), 
当 这 两 个 任务 都 需要 不 可 能 同时 使 用 的 某 种 资源 时 ， 这 两 个 任务 之 间 需 要 竞争 同步 
(competition synchronization)。 特 别 是， 如果 任 务 A 要 访问 共享 数据 单位 x， 而 任务 B 正 在 处 理 %， 
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则 任务 A 必须 等 待 任务 B 完 成 对 于 x 的 处 理 ， 不 论 这 是 什么 样 的 处 理 。 因 此 在 合作 同步 中 ， 任 务 
可 能 需要 等 待 完成 某 一 种 处 理 ， 它 们 操作 的 正确 性 取决 于 这 种 处 理 ， 然 而 在 竞争 同步 中 ， 任 务 
可 能 需要 等 待 其 他 的 任务 完成 在 共享 数据 上 正在 进行 的 任何 处 理 。 

可 以 使 用 被 称 为 “生产 者 -消费 者 问题 ”的 例子 来 说 明 一 个 简单 形式 的 合作 同步 。 这 个 问 
题 起 源 于 操作 系统 的 开发 ， 其 中 一 个 程序 单位 产生 某 一 种 数据 值 或 资源 ， 而 另外 的 一 个 程序 
单位 将 使 用 它 。 通 常 ， 所 产生 的 数据 值 被 生产 的 单位 放 在 一 个 存储 缓冲 区 ， 然 后 再 被 消费 的 
单位 从 缓冲 区 中 取 走 。 这 种 在 缓冲 区 里 存放 和 取 走 的 操作 必须 是 同步 的 。 如 果 缓 冲 区 是 空 的 ， 
消费 单位 不 被 允许 从 缓冲 区 取 走 数据 。 如 果 缓 冲 区 是 满 的 ， 生 产 单位 也 不 被 允许 往 缓冲 区 存 
放 数据 。 这 就 是 被 称 为 合作 同步 的 问题 ， 因 为 要 想 正确 地 使 用 缓冲 区 ， 共 享 数 据 的 使 用 者 们 
就 必须 合作 。 

苑 和 争 同 步 防 止 两 个 任务 在 同一 时 间 同 时 存 取 一 个 共享 的 数据 结构 ， 这 种 情况 可 能 会 破坏 共 
享 数据 的 正确 性 。 要 提供 竞争 同步 ， 就 必须 要 保证 共享 数据 的 互 斥 访问 。 

为 了 证 清 竞 争 问题 ， 让 我 们 来 考虑 下 列 情 节 : 假设 任务 A 必 须 把 1 加 到 共享 整数 变量 TOTAL 
上 ，TOTAL 的 初 值 是 3。 此 外 ， 任 务 B 要 将 TOTAL 的 值 乘 以 2。 这 两 个 任务 都 分 别 进行 下 面 3 步 的 
过 程 : 

1) 从 TOTAL 取 得 数值 ， 

2) 在 数值 上 进行 算术 操作 ， 

3) 然后 再 将 新 的 值 放 回 TOTRAL。 

如 琳 没 有 竞争 同步 ， 它 们 的 操作 可 能 会 产生 三 个 不 同 的 值 。 如 果 在 任务 B 开 始 之 前 ， 任 务 A 
已 经 完成 了 它 的 操作 ，TOTAL 的 值 将 会 是 8。 我 们 假设 这 是 正确 的 结果 ， 但 是 如 果 A 和 B 都 是 在 
男 一 方 将 它 的 新 值 放 回 原 处 之 前 取得 的 TOTAL 的 原 值 ， 结 果 将 会 是 不 正确 的 。 如 果 A 首 先 将 它 
的 新 值 放 回 原 处 ，TOTAL 的 值 将 会 是 6。 图 13-1 中 显示 了 这 种 情形 。 如 来 B 首 先 将 它 的 新 值 放 回 
原 处 ，TOTAL 的 值 将 会 是 4。 有 时 将 导致 这 种 问题 的 这 种 情形 ， 称 为 竞争 条 件 ， 因 为 两 个 或 多 
个 任务 相互 竞争 使 用 它们 共享 的 资源 ， 而 且 这 个 问题 的 行为 取决 于 哪 一 个 任务 首先 获得 了 这 个 
资源 。 现 在 ， 竞 争 同步 的 重要 性 应 该 是 很 清楚 的 了 。 

TOTAL 的 值 为 3 一 


图 13-1 竞争 同步 对 比 举例 


对 于 共享 资源 提供 互 斥 访问 的 一 般 方 法 ， 是 将 资源 看 成 任务 可 以 拥有 的 某 种 物体 ， 并 且 在 
任何 时 刻 只 允许 一 个 任务 来 拥有 它 。 为 了 得 到 一 个 共享 资源 ， 任 务必 须 首先 请 求 它 。 当 一 个 任 
务 使 用 完了 它 所 拥有 的 共享 资源 时 ， 就 必须 放弃 对 于 资源 的 持 有 ， 以 便 其 他 的 任务 可 以 来 使 用 。 

提供 对 于 共享 资源 互 斥 访问 的 三 种 方法 是 : 将 在 13.3 节 中 讨论 的 信号 量 ， 将 在 13.4 节 中 讨论 
的 管 程 和 将 在 13.5 节 中 讨论 的 消息 传递 。 

同步 机 制 必须 能 够 延迟 任务 的 执行 。 同 步 将 一 个 执行 次 序 强加 到 任务 之 上 。 这 种 次 序 由 延 
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迟 来 实现 。 要 理解 在 任务 的 生存 期 间 发 生 了 什么 ， 我 们 必须 考虑 任务 执行 是 怎样 被 控制 的 。 不 


” 论 一 部 机 器 具有 单个 还 是 多 个 处 理 器 ， 总 会 存在 任务 多 于 处 理 器 的 可 能 性 。 调 度 程序 (scheduler) 


管理 任务 间 对 于 处 理 器 的 共享 。 如 果 从 来 就 没有 任何 中 断 ， 并 且 所 有 任务 都 有 相同 的 优先 级 ， 
调度 程序 可 以 只 给 每 个 任务 很 短 的 一 个 时 间 片 ， 例 如 0.1 秒 。 当 轮 到 一 个 任务 执行 时 ， 调 度 程 
序 让 它 在 一 个 处 理 器 上 仅 运 行 一 段 给 定 长 度 的 时 间 。 当 然 ， 会 存在 很 多 使 情况 复杂 化 的 事件 ， 
例如 ， 为 了 同步 而 延迟 以 及 为 了 等 待 输入 输出 操作 而 延迟 。 任 务 可 能 处 于 几 种 不 同 的 状态 之 中 ， 
这 些 状 态 是 : 

1) 新 生 状 态 : 一 个 任务 刚 被 创建 、 但 还 没有 开始 执行 时 ， 这 个 任务 处 于 新 生 状 态 。 

2) 可 运行 状态 、 或 就 绪 状 态 : 一 个 可 运行 任务 ， 是 准备 好 运行 但 当前 还 没有 运行 的 任务 。 
或 者 是 因为 调度 程序 还 没有 给 处 理 器 以 时 间 ， 或 者 它 先 前 已 经 运行 过 了 ， 但 被 下 面 第 四 段 所 描 
述 的 一 个 方式 所 阻止 。 将 可 运行 任务 存储 于 一 个 通常 被 称 为 任务 就 绪 队 列 (task ready queue) 


的 队 中 。 
3) 运行 状态 : 一 个 运行 的 任务 ， 是 一 个 当前 正在 执行 的 任务 ， 也 就 是 说 ， 这 个 任务 具有 一 
个 处 理 器 ， 并 正在 执行 这 个 任务 的 代码 。 


4) 阻塞 状态 : 一 个 被 阻塞 的 任务 已 经 被 运行 ， 但 任务 的 执行 被 某 一 事件 所 打 断 ， 最 通常 的 
是 输入 或 输出 操作 的 事件 。 因 为 输入 和 输出 操作 比 程 序 的 执行 慢 得 多 ， 一 个 任务 开始 了 一 个 输 
入 或 输出 操作 后 ， 当 它 在 等 候 输 入 或 输出 操作 完成 时 ， 它 会 被 阻止 使 用 处 理 器 。 除 了 这 些 类 型 
的 阻塞 而 外 ， 一 些 语言 还 给 用 户 程序 提供 一 些 操作 ， 用 以 说 明 某 一 个 任务 应 该 被 阻塞 。 

5) 死亡 状态 : 死亡 的 任务 就 不 再 活跃 。 在 完成 了 一 个 任务 的 执行 之 后 ， 或 者 是 一 个 任务 被 
程序 显 式 地 撤销 之 后 ， 这 个 任务 就 成 为 死亡 的 任务 。 

任务 执行 中 的 一 个 重要 的 问题 : 是 当前 正在 运行 的 任务 已 经 变 成 阻塞 状态 时 ， 或 者 是 已 经 
用 完 它 的 时 间 片 时 ， 怎 样 来 选择 一 个 就 绪 任 务 移入 运行 的 状态 ?有 几 种 可 供 选 择 的 不 同 算法 ， 
其 中 的 一 些 是 基于 可 说 明 的 优先 级 。 选 择 算 法 是 在 调度 程序 中 实现 。 

活性 的 概念 ， 与 任务 的 当前 执行 及 共享 资源 的 使 用 相关 联 。 在 顺序 执行 的 程序 的 环境 中 ， 
如 采 一 个 程序 继续 运行 、 并 最 终 导致 执行 的 最 后 完成 ， 这 个 程序 就 具有 活性 (liveness) 的 特征 。 
在 更 加 通用 的 术语 里 ， 活 性 则 意味 着 : 如 果 一 个 事件 (例如 程序 的 完成 ) 是 应 该 发 生 的 ， 它 终 
将 发 生 。 这 就 是 说 ， 执 行 不 断 地 推进 着 。 在 并 发 和 使 用 共享 资源 的 环境 中 ， 任 务 的 活性 可 能 会 
停止 存在 ， 这 意味 着 程序 不 能 够 继续 运行 ， 并 因此 会 永 不 


终止 。 
PL/I 是 第 一 种 包括 并 发 任务 , oa po 
的 程序 设计 语言 。 它 允许 并 发 地 例如 ， 假 设 任务 A 和 任务 B 都 需要 共享 的 资源 Xx 和 Y 以 完 


成 它们 的 工作 。 进 一 步 再 假设 ， 任 务 A 已 持 有 Xx， 并 且 任 务 B 
a cr A BAZE, A 需要 资源 ?以 继 续 它 的 执行 ， 
因此 它 请 求 Y， 但 必须 等到 B 释 放 Y。 同 时 ， 任 务 B 请 求 X， 
但 也 必须 等 待 释 放 X。 这 个 任务 都 不 放弃 它们 所 持 有 的 次 
源 ， 结 果 这 两 者 都 失去 了 活性 ， 程 序 执行 将 永远 不 能 正常 
地 完成 。 这 种 类 型 的 失去 活性 ， 被 称 为 死 锁 (deadlock). 
死 锁 对 于 程序 的 可 靠 性 是 一 种 严重 的 威胁 ， 因 此 在 语言 和 
程序 设计 中 需要 认真 考虑 避免 死 锁 的 发 生 ， 

我 们 现在 已 经 准备 进行 关于 提供 并 发 单位 控制 的 语言 
机 制 的 讨论 。 


调用 的 子 程序 。 然 而 ， 为 这 些 并 
发 执行 而 实现 的 同步 机 制 ， 却 并 
不 充分 。 这 种 同步 机 制 仅仅 包括 
了 被 称 为 事件 的 二 元 信号 量 ， 以 
及 任务 完成 执行 时 对 于 信号 量 进 
行 检测 的 功能 。 | 
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次 的 并 发 ， 并 且 包 括 了 一 个 名 为 
sema 的 信号 量 数据 类 型 
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13.2.2 为 并 发 而 设计 的 语言 


许多 语言 被 设计 来 支持 并 发 ， 从 20 世 纪 60 年 代 中 期 的 PLI 开 始 ， 包 括 当 代 语言 Ada 95, 
Java、C# Python 和 Ruby。 


13.2.3 设计 问题 


支持 并 发 的 语言 的 最 重要 的 设计 问题 ， 已 经 在 前 面 进行 了 讨论 : 竞争 同步 与 合作 同步 。 除 
此 之 外 ， 还 有 一 些 次 重要 的 设计 问题 。 例 如 ， 怎 样 提供 任务 的 调度 。 另 外 ， 怎 样 以 及 何 时 开始 
任务 的 执行 和 结束 任务 执行 的 问题 ， 还 有 ， 怎 样 以 及 何 时 创建 任务 的 问题 。 

请 记 住 ， 我 们 不 打算 对 并 发 进行 全 面 的 讨论 。 我 们 仅仅 讨论 那些 与 支持 并 发 有 关 的 最 重要 
的 设计 问题 。 

在 以 下 几 节 里 ， 我 们 将 讨论 并 发 设计 问题 的 三 种 答案 : 信号 量 、 管 程 和 消息 传递 。 


13.3 -信和 号 量 


二 号 量 是 一 种 能 够 用 来 提供 任务 同步 的 简单 机 制 。 我 们 将 在 下 面 的 段落 中 描述 信号 量 ， 并 
讨论 如 何 能 够 将 它们 用 于 这 个 目的 。 


13.3.1 介绍 


在 对 于 共享 数据 结构 的 互 斥 访问 提供 竞争 同步 的 工作 中 ，Edsger Dijkstra 在 1965 年 设计 了 
HSH (Dijkstra, 1968b) 。 信 号 量 也 能 够 被 用 来 提供 合作 同步 。 

信号 量 (semaphore) 是 一 种 数据 结构 ， 它 由 一 个 整数 和 一 个 存储 任务 描述 符 的 队 所 组 成 ， 
任务 描述 符 (task descriptor) 也 是 一 种 数据 结构 ， 它 存储 有 关 任 务 执行 状态 的 相关 信息 。 信 号 
量 的 概念 是 : 为 了 提供 对 于 一 种 数据 结构 的 有 限制 的 访问 ， 而 将 守卫 放置 于 存 取 这 个 数据 结构 
的 代码 附近 。 守 卫 (guard) 是 一 种 语言 装置 ， 它 只 能 允许 被 守卫 的 代码 运行 于 某 种 被 说 明 的 条 
件 之 下 。 和 守卫 能 够 被 用 来 保证 任何 时 候 只 有 一 个 任务 存 取 一 个 共享 的 数据 结构 。 信 和 号 量 是 守卫 
的 实现 。 守 卫 机 制 中 的 一 种 不 可 缺少 的 技术 是 要 确保 所 有 对 被 守卫 的 代码 的 访问 企图 ， 终 将 如 
愿 以 侵 。 这 种 技术 将 暂时 不 能 够 被 允许 的 访问 请 求 ， 存 储 在 任务 描述 符 的 队 之 中 。 之 后 ， 将 个 
许 这 些 请 求 离开 ， 并 执行 被 守卫 的 代码 。 这 就 是 之 所 以 一 个 信号 量 是 由 一 个 计数 器 ， 和 一 个 任 
务 擅 述 符 的 队 所 组 成 的 原因 。 

提供 给 信号 量 的 仅 有 的 两 种 操作 ， 最 早 由 Dijkstra 命 名 为 P 和 V， 它 们 分 别 来 自 于 两 个 荷兰 文 
In] passeren (通过 ) 和 vrygeren (释放 ) (Andrews and Schneider, 1983)。 我 们 在 下 面 的 讨论 中 
将 分 别称 这 两 种 操作 为 :“ 等 待 ”与 “释放 ”。 

下 面 小 市 将 用 最 常见 的 应 用 来 描述 信号 量 提 供 守 卫 的 过 程 。 


13.3.2 合作 同步 


在 本 章 的 许多 地 方 ， 我 们 将 使 用 一 个 共享 缓冲 区 的 示例 ， 来 说 明 几 种 不 同 的 提供 合作 同步 
和 苋 搜 同步 的 方法 。 为 了 进行 合作 同步 ， 这 个 缓冲 区 必须 具有 一 个 方法 ， 来 记录 缓冲 区 中 空位 
的 个 数 以 及 被 填充 位 置 的 个 数 。 信 号 量 的 计数 器 能 够 部 分 地 用 于 这 种 目的 。 能 够 使 用 二 个 信号 
量变 量 emptyspots 存 储 共享 缓冲 区 中 空位 置 的 数目 ， 而 能 够 使 用 另外 的 一 个 信号 量变 量 
fullspots 来 存储 缓冲 区 中 被 填充 位 置 的 数目 。 而 使 用 这 两 个 信号 量 的 任务 描述 符 队 ， 来 存储 
锌 信号 量 的 延迟 操作 所 阻塞 的 任务 。 
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我 们 将 缓冲 区 的 例子 设计 为 一 种 抽象 数据 类 型 ， 所 有 的 数据 都 经 过 子 程序 DEPOSIT 进 入 组 
冲 区 ,并 经 过 子 程序 FETCH 离 开 缓 冲 区 。 这 样 ， 子 程序 DEPOSIT 只 需要 检测 信号 量 emptyspots， 
就 能 够 知道 是 否 存在 着 空位 置 。 如 果 存 在 着 至 少 一 个 空位 ， 子 程序 DEPOSIT 就 将 继续 执行 。 子 
程序 DEPOSIT 必 须 包 括 ， 将 emptyspots 的 计数 器 减 值 的 功能 。 如 果 缓 冲 区 已 经 占 满 了 ， 
DEPOSIT 的 调用 程序 就 必须 在 emptyspots 的 任务 描述 符 队 之 中 等 和 候 ， 直 到 可 以 获得 一 个 空位 
置 。 当 子 程序 DEPOSIT 完 成 操作 时 ， 它 将 增加 fullspots 信 号 量 计数 器 的 值 ， 指 示 缓 冲 区 中 
增加 了 一 个 被 填充 的 位 置 。 

子 程序 FETCH 与 子 程序 DEPOSIT 具 有 着 相反 的 执行 序列 。 子 程序 FETCH 检 查 fullspots 
言 写 量 ， 以 确定 缓冲 区 中 是 否 至 少 包含 了 一 个 项 。 如 果 是 的 话 ， 这 个 项 将 被 删除 ， 并 且 信 号 量 
emptyspots 的 计数 絮 的 值 将 增加 1。 如 果 缓 冲 区 为 空 的 话 ， 将 调用 进程 放置 于 fullspots 的 
任务 摘 述 符 的 队 中 等 候 ， 直 到 在 缓冲 区 中 出 现 一 个 项 为 止 。 当 子 程序 FETCH 执 行 完成 时 ， 它 必 
须 增加 emptyspots 的 计数 器 的 值 。 

对 于 信号 量 类 型 的 操作 通常 不 是 直接 的 ， 而 是 通过 等 待 与 释放 子 程序 来 进行 。 因 此 ， 上 面 
所 拉 述 的 子 程序 DEPOSIT 的 部 分 操作 实际 上 是 通过 调用 等 待 与 释放 子 程序 来 完成 的 。 请 注意 ， 
等 待 与 释放 子 程序 必须 可 以 访问 任务 就 绪 队 。 

使 用 等 待 子 程序 来 测试 给 定 信号 量变 量 的 计数 器 。 如 果 这 个 计数 器 的 值 大 于 零 ， 调 用 程序 
就 能 够 进行 操作 。 在 这 种 情况 下 ， 信 和 号 量变 量 计数 器 的 值 被 减 1 以 指示 少 了 一 项 。 如 果 这 个 计 
数 右 的 值 为 堆 ， 就 必须 将 调用 程序 放置 于 信号 量变 量 的 等 候 队 之 中 ， 并 且 必 须 将 处 理 器 传递 给 
其 他 的 就 绪 任务 。 

一 个 任务 将 使 用 释放 操作 ， 来 允许 某 个 其 他 的 任务 得 到 一 个 被 信号 量变 量 的 计数 器 所 计数 
的 事物 。 如 有 果 这 个 信号 量变 量 的 队 为 空 就 意味 着 没有 任务 在 等 候 ， 释 放 操作 则 会 增加 计数 器 的 
值 (指示 多 了 一 个 可 用 的 被 控制 的 事物 ) ， 如果 有 一 个 或 多 个 任务 在 等 候 ， 释 放 操 作 将 它们 中 
的 一 个 从 信号 量 的 等 候 队 中 移 到 就 绪 队 之 中 。 

下 面 是 对 于 等 待 操作 与 释放 操作 的 简略 描述 : 


wait(aSemaphore) 

if aSemaphore 的 计数 器 > 0 then 
aSemaphore 的 计数 器 减 1 

else 
将 调用 程序 放置 于 aSemaphore 的 队 中 
尝试 将 控制 传递 给 一 个 就 绪 任 务 
(如 果 就 绪 任 务 队 为 空 ， 死 锁 发 生 ) 


end if 


release(aSemaphore) 

if aSemaphore 的 队 为 空 (没有 任务 在 等 待 ) then 
aSemaphore 的 计数 器 加 1 

else 


将 调用 任务 放置 于 就 绪 任务 队 中 
wo ee ee 
我 们 现在 可 以 给 出 一 个 示例 程序 ， 这 个 程序 为 一 个 共享 缓冲 区 实现 合作 同步 。 在 此 例 中 ， 
共享 缓冲 区 存储 整数 值 ， 并 被 构造 成 一 个 逻辑 的 环形 结构 。 这 个 共享 缓冲 区 被 设计 来 支持 多 生 
产 者 与 多 消费 者 的 任务 。 
下 面 的 虚拟 码 显 示 了 这 种 生产 者 任务 与 消费 者 任务 的 定义 。 使 用 了 两 个 信号 量 来 防止 缓冲 
区 的 下 洪 与 上 溢 ， 并 因此 提供 合作 同步 。 假 设 缓冲 区 的 长 度 为 BUFLEN， 并 且 已 经 存在 着 实际 
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操纵 缓冲 区 的 子 程序 FETCH 和 DEPOSIT。 对 于 信号 量 计 数 器 的 访问 使 用 点 来 标记 。 例 如 ， 如 果 
fullspots 是 一 个 信号 量 ， 它 的 计数 如 则 由 fullspots .count 来 引用 。 


semaphore fullspots, emptyspots; 
fullspots.count = 0; 
emptyspots.count = BUFLEN; 
task producer; 
loop 
-- "+E VALUE-- 
wait(emptyspots) ; {等 待 一 个 位 置 } 
DEPOSIT (VALUE); 
release(fullspots); {增加 占 满 了 的 位 置 } 
end loop; 
end producer; 


task consumer; 
loop 
wait(fullspots); {确保 它 不 是 为 空 } 
FETCH ( VALUE); 
release(emptyspots); {增加 为 空 的 位 置 } 
-消费 VALUE ~ 
end loop 

end consumer; 


如 来 共享 缓冲 区 当前 为 空 ， 信 号 量 ful11lspots 将 使 得 gconsumer 任 务 进入 队 之 中 ， 以 等 待 
缓冲 区 的 项 。 如 果 共 享 缓冲 区 当前 已 满 ， 信 号 量 emptyspots 将 使 得 producer 任 务 进入 队 之 
中 ， 以 等 待 缓 冲 区 的 空位 置 。 


13.3.3 竞争 同步 


我 们 上 面 的 缓冲 区 的 例子 不 提供 竞争 同步 。 对 于 这 种 结构 的 访问 ， 可 以 使 用 一 个 附加 的 信 
号 量 来 控制 。 这 个 附加 的 信号 量 并 不 需要 进行 任何 计数 ， 它 仅仅 使 用 计数 器 来 指示 缓冲 区 是 否 
当前 正在 被 使 用 。 如 果 这 个 信号 量 的 计数 器 为 1，wait 语 句 人 允许 访问 缓冲 区 ， 数 值 1 表示 共享 
缓冲 区 现在 没有 被 访问 。 如 果 这 个 信号 量 的 计数 器 为 0， 则 表示 缓冲 区 当前 正 被 访问 ， 此 时 将 
任务 放 入 信号 量 的 队 之 中 。 请 注意 ， 必 须 将 信号 量 计数 器 的 初 值 设 为 1， 也 即 必 须 将 信号 量 的 
以 初始 化 为 空 。 

如 采 一 个 信号 量 只 需要 一 个 二 元 计数 器 ， 如 我 们 用 来 提供 竞争 同步 的 信号 量 那样 ， 就 称 这 
个 信号 量 为 二 元 信和 号 量 (binary semaphore), 

下 面 的 示例 代码 说 明 ， 怎 样 使 用 信号 量 为 当前 被 访问 的 共享 缓冲 区 提供 竞争 同步 与 合作 
同步 。 使 用 信号 量 access 来 确保 对 于 缓冲 区 的 互 斥 访问 。 再 次 请 注意 ， 可 能 存在 着 多 生产 者 
以 及 多 消费 者 。 


semaphore access, fullspots, emptyspots; 
access.count = 1; 

fullspots.count = 0; 

emptyspots.count = BUFLEN; 


task producer; 


loop 

-- 产生 VALUE -- 

wait(emptyspots) ; {等 待 一 个 位 置 } 
wait(access); {等 待 访问 } 


DEPOSIT (VALUE ; 
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release(access); {BFE le] } 
release(fullspots) ; { 增 加 占 满 了 的 位 置 } 
end loop; 


end producer; 


task consumer; 


loop 

wait(fullspots); { 确 保 它 不 是 为 空 } 
wait(access); { 等 待 访问 } 
FETCH (VALUE ) ; 

release(access) ; { 放 弃 访 问 } 
release(emptyspots); {增加 为 空 的 位 置 } 
-- 消费 VALUE -- 

end loop 


end consumer; 

如 来 只 是 粗略 地 看 一 下 这 个 例子 ， 可 能 会 相信 它 有 问题 。 设 想 一 个 任务 正 等 候 consumer 
中 的 wait (access ) 的 调用 , 而 另外 一 个 任务 从 共享 缓冲 区 取 走 了 最 后 的 一 个 值 。 但 幸运 的 是 ， 
这 是 不 可 能 发 生 的 。 因 为 wvait (fullspots ) 通 过 将 fullspots 的 计数 器 减 1， 为 调用 它 的 任 
务 在 缓冲 区 中 保留 了 一 个 值 。 

到 目前 为 止 ， 我 们 还 没有 讨论 信号 量 的 一 个 关键 方面 。 回 忆 我 们 在 前 面 对 于 竞争 同步 问题 
的 描述 : 不 能 够 重 载 共 享 数据 上 的 操作 。 如 果 前 面 的 操作 仍然 在 进行 ， 而 后 面 的 操作 却 已 经 开 
始 ， 它 们 所 共享 的 数据 可 能 就 会 不 正确 。 一 个 信号 量 本 身 就 是 一 个 共享 数据 对 象 ， 因 而 信号 量 
的 操作 也 会 受到 同样 问题 的 影响 。 所 以 最 根本 的 问题 是 ， 信 和 号 量 的 操作 是 不 能 够 被 中 断 的 。 许 
多 计算 机 都 具有 为 信号 量 操作 而 明确 设计 的 非 中 断 指令 。 如 果 没 有 这 种 指令 的 话 ， 使 用 信号 量 
来 提供 竞争 同步 将 产生 严重 的 问题 ， 而 且 还 没有 简单 的 解决 方法 。 


13.3.4 评估 


使 用 信号 量 提供 合作 同步 ， 产 生 非 安全 的 程序 设计 环境 。 不 存在 静态 的 方式 来 检测 信号 量 
使 用 的 正确 性 ， 这 种 使 用 的 正确 性 完全 依赖 于 信号 量 所 出 现 的 程序 的 语义 。 在 缓冲 区 的 示例 中 ， 
如 末 producer 任 务 不 包括 wait (emptyspots ) 语 句 ， 将 会 造成 缓冲 区 的 上 溢 。 如 果 
consumer 任 务 不 包括 wait (fullspots ) 语 句 ， 则 会 造成 缓冲 区 的 下 溢 。 如 果 遗 漏 任何 释放 
操作 ， 都 会 造成 死 锁 。 这 些 情形 都 是 合作 同步 的 失败 。 

使 用 信号 量 提供 合作 同步 ， 产 生 可 靠 性 的 问题 ， 使 用 信和 号 量 来 提供 竞争 同步 时 ， 也 会 出 现 
同样 的 问题 。 如 果 在 任意 一 个 任务 中 没有 包括 wait (access ) 语 名 的 话 ， 将 引起 对 于 缓冲 区 的 
非 安 全 的 访问 。 而 如 果 在 任意 一 个 任务 中 没有 包括 release (access ) 语 句 ， 将 会 引起 死 锁 ， 
这 些 情形 都 是 竞争 同步 的 失败 。Brinch Hansen 注 意 到 了 使 用 信号 量 的 危险 性 ， 他 曾经 写 道 :“ 对 
于 一 位 从 不 犯错 误 的 理想 程序 员 ， 信 和 号 量 是 一 种 优雅 的 同步 工具 ”(Brinch Hansen，1973)。 然 
而 ， 这 样 的 程序 人 员 却 极 少 有 。 i 


13.4 BE 


解决 并 发 环境 中 信号 量 问题 的 一 种 办 法 ， 是 将 共享 数据 结构 与 对 于 这 些 结构 的 操作 封装 在 
一 起 ， 并 且 将 这 些 数据 结构 的 表示 藏匿 起 来 ， 也 就 是 说 ， 将 共享 数据 结构 定义 为 抽象 数据 类 型 ， 
这 种 解决 方法 能 够 将 同步 的 责任 转移 到 运行 时 系统 ， 以 便 提供 不 具有 信号 量 的 竞争 同步 ， 


13.4.1 介绍 
在 制定 数据 抽象 的 概念 时 ， 参 与 这 项 工作 的 人 员 将 相同 的 概念 运用 于 并 发 程序 设计 环境 的 
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共享 数据 ， 从 而 生产 管 程 。 根 据 Brinch Hansen (Brinch Hansen, 1977, p. xvi), Edsger Dijkstra 
在 1971 年 曾经 做 出 的 提议 : 应 该 将 共享 数据 上 的 所 有 同步 操作 包括 进 一 个 程序 单位 之 中 。 
Brinch Hansen 在 操作 系统 的 环境 中 使 得 这 项 概念 形式 化 (Brinch Hansen，1973)。 第 二 年 ， 
Hoare 将 这 种 结构 命名 为 管 程 (Hoare, 1974), | 

第 一 种 提供 管 程 的 程序 设计 语言 是 并 发 Pascal (Brinch Hansen, 1975), Modula (Wirth, 
1977), CSP/k (Holt et al., 1978) 和 Mesa (Mitchell et al., 1979) 也 提供 了 管 程 。 在 当代 语言 
中 ，Ada，Java 和 C# 支 持 管 程 ， 关 于 这 些 ， 我 们 将 在 本 章 以 下 部 分 进行 讨论 。 


13.4.2 竞争 同步 


管 程 最 重要 的 特性 之 一 ， 是 共享 数据 居于 管 程 之 中 而 不 是 居于 任何 客户 单位 之 中 。 这 样 ， 
程序 人 员 就 不 需要 通过 使 用 信号 量 或 者 是 其 他 的 机 制 ， 来 同步 共享 数据 的 互 斥 访问 。 因 为 所 有 
的 访问 都 发 生 在 管 程 中 ， 所 以 能 够 将 管 程 实现 为 任何 时 刻 只 允许 一 个 访问 的 结构 ， 从 而 保证 同 
步 访 问 。 当 对 于 管 程 的 调用 繁忙 时 ， 会 将 一 些 调用 隐 性 地 放 入 队 之 中 。 


13.4.3 合作 同步 


虽然 互 不 访问 之 共享 数据 是 通过 管 程 的 内 部 ， 然 而 一 些 进程 之 间 的 合作 仍然 是 程序 人 员 的 
责任 。 特 别 是， 程序 人 员 必 须 保 证 一 个 共享 缓冲 区 不 会 出 现下 溢 或 上 溢 。 不 同 的 语言 提供 不 同 
的 方式 ， 来 进行 合作 同步 的 程序 设计 。 所 有 的 这 些 方式 都 与 信号 量 有 关 。 

图 13-2 中 显示 一 个 包含 了 四 个 进程 和 一 个 管 程 的 程序 ， 管 程 提供 对 于 一 个 并 发 共享 缓冲 区 
的 同步 访问 。 此 图 中 ， 管 程 的 接口 显示 在 插入 和 删除 框 中 (为 了 插入 和 删除 数据 ) 。 











图 13-2 一 个 使 用 管 程 来 控制 共享 缓冲 区 访问 的 程序 


13.4.4 评估 


束 提 供 苑 争 同步 而 言 ， 管 程 是 一 种 比 信 号 量 更 好 的 方法 ， 这 主要 是 因为 信号 量 方法 中 所 存 
在 的 一 些 问 题 ， 如 曾经 在 13.3 节 中 讨论 过 的 。 在 使 用 管 程 时 ， 合 作 同 步 仍然 是 存在 的 问题 ， 关 
于 这 一 点 ， 在 下 面 讨 论 了 Ada 和 Java 的 管 程 实现 后 ， 将 会 变 得 更 加 清晰 。 

在 并 发 控制 的 表示 方面 ， 信 号 量 和 管 程 一 样 功能 强大 一 一 可 以 使 用 信号 量 来 实现 管 程 , 也 可 
以 使 用 管 程 来 实现 信号 量 。 

Ada 提 供 了 两 种 方式 来 实现 管 程 。Ada 83 包 括 了 一 种 可 以 用 来 实现 管 程 的 通用 任务 模型 。 
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Ada 95 则 增加 了 一 种 更 为 简洁 及 高 效 的 方式 来 构造 管 程 ， 称 为 受 保护 的 对 象 (protected object), 


这 两 种 方式 都 是 以 消息 传递 为 基础 模型 来 支持 并 发 的 。 消 息 传递 模型 允许 并 发 的 程序 单位 为 分 
布 式 的 ; 然而 管 程 却 不 允许 分 布 式 的 并 发 的 程序 单位 。 关 于 消息 传递 将 在 下 面 的 小 节 中 讨论 ， 
关于 Ada 语 言 对 于 消息 传递 的 支持 ， 则 将 在 13.6 节 中 讨论 。 


13.5 消息 传递 
这 一 小 节 介 绍 消息 传递 的 基本 概念 。13.6 节 将 详细 描述 Ada 对 消息 传递 方法 的 支持 。 
13.5.1 MÆ 


取 早 尝试 提供 并 发 任务 之 间 的 消息 传递 能 力 的 语言 设计 是 Brinch Hansen (1978) 和 Hoare 
(1978) 的 工作 。 消 息 传递 的 先驱 开发 人 员 还 开发 了 一 种 技术 ， 处 理 当 一 个 给 定 任务 同时 收 到 来 
目 其 他 任务 的 多 个 请 求 时 ， 应 该 如 何 处 置 的 问题 。 当 时 决定 需要 某 种 非 确 定性 的 方式 ， 以 便 在 
多 个 请 求 中 公平 地 选择 一 个 首先 执行 。 存 在 着 关于 这 种 公平 性 的 各 种 不 同 的 定义 ， 然 而 在 大 体 
上 这 种 公平 性 的 意义 是 : 所 有 请 求 者 都 具有 与 给 定 任务 通信 的 平等 机 会 (假设 每 一 个 请 求 者 都 有 
同样 的 优先 级 别 )。Dijkstra (1975) 首创 了 用 于 语句 层次 上 来 控制 的 非 确定 性 结构 被 称 为 守卫 
的 命令 (guarded command) 。( 守 卫 的 命令 曾经 在 第 8 章 中 进行 过 讨论 。) 守卫 的 命令 是 控制 消息 
传递 的 设计 的 结构 基础 。 


13.5.2 同步 消息 传递 的 概念 


消 昌 传递 可 以 是 同步 的 ， 也 可 以 是 异步 的 。 在 13.6.8 小 节 中 将 描述 Ada 95 的 异步 消息 传 
Bs 在 这 里 ， 我 们 描述 同步 消息 传递 。 同 步 消 息 传递 的 基本 概念 是 ， 任 务 通常 是 很 忙碌 的 ， 忙 
碌 时 不 希望 被 其 他 的 单位 所 中 断 。 假 如 任务 AR 和 任务 B 都 是 在 执行 之 中 ， 而 且 任务 A 需 要 传递 一 
个 消息 给 任务 B。 显 然 ， 如 果 B 很 忙碌 ， 它 就 不 愿意 让 其 他 的 任务 来 中 断 自己 的 执行 。 因 为 这 将 
打 乱 8B 当前 的 工作 。 此 外 ， 消 息 的 到 来 常常 使 得 接收 者 去 进行 相关 的 处 理 ， 在 其 他 处 理 还 没有 
完成 时 ， 这 通常 是 不 明智 的 。 一 种 替代 方案 是 提供 一 种 语言 机 制 ， 以 允许 一 个 任务 在 它 准备 好 
接收 消息 时 告诉 其 他 的 任务 。 这 个 方法 像 一 个 主管 告诉 他 的 秘书 让 打 来 的 电话 都 进行 等 候 ， 直 
到 田 外 一 个 活动 (也许 是 一 个 重要 会 议 ) 结束 以 后 。 此 时 ， 主 管 告诉 秘书 他 现在 愿意 接听 那些 
在 等 候 的 电话 。 

一 个 任务 应 该 能 够 在 某 一 个 时 刻 暂 时 停止 它 的 执行 ， 或 者 是 因为 它 无 事 可 干 ， 或 者 是 它 需 
要 来 日 另外 一 个 单位 的 数据 才能 够 继续 执行 。 这 正 像 一 个 在 等 待 重要 电话 的 人 。 在 某 些 情况 下 ， 
没有 事情 可 做 ， 只 能 坐等 。 在 这 种 情形 下 ， 如 果 任 务 A 需要 发 送 一 个 消息 给 任务 B， 并 且 任 务 B 
愿意 接收 ， 消 息 就 能 够 被 传递 过 来 。 这 种 实际 的 传输 被 称 为 会 合 (rendezvous)。 注 意 ， 会 合 只 
能 够 发 生 在 发 送 者 和 接收 者 都 希望 它 发 生 的 时 候 。 

如 在 下 面 的 几 闻 里 所 描述 的 ， 任 务 的 合作 同步 与 竞争 同步 都 能 够 方便 地 使 用 消息 传递 的 模 
型 来 进行 处 理 。 


13.6 Ada 对 并 发 的 支持 


这 一 小 慷 描 述 Ada 对 于 并 发 的 支持 。Ada 83 仅仅 支持 同步 消息 传递 。 在 Ada 95 中 增加 了 对 
于 异步 消息 传递 的 支持 。 
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13.6.1 基本 概念 


Ada 中 对 于 任务 的 设计 部 分 地 基于 Brinch Hansen 和 Hoare 的 工作 ;其 中 的 消息 传递 是 这 种 设 
计 的 基础 ， 并 且 使 用 非 确 定性 在 竞争 传递 消息 的 任务 中 来 进行 选择 。 

完整 的 Ada 任 务 模型 十 分 复杂 ， 因 而 下 面 仅 仅 是 对 于 这 种 任务 模型 的 有 限 的 讨论 。 我 们 在 
这 里 的 重点 将 放 在 Ada 版 本 中 的 同步 消息 传递 机 制 上 。 

Ada 任 务 可 能 比 管 程 更 加 活跃 。 管 程 是 被 动 的 实体 ， 它 为 存储 的 共享 数据 提供 管理 服务 。 
然而 ， 只 有 当 服 务 被 请 求 时 管 程 才 提 供 这 些 服务 。 当 使 用 Ada 的 任务 来 管理 共享 数据 时 ， 可 以 
认为 这 些 任务 是 与 所 管理 的 资源 在 一 起 的 管理 者 。 任 务 具 有 几 种 管理 机 制 ， 一 些 是 确定 性 的 ， 
一 些 是 非 确 定性 的 。 这 允许 了 任务 在 对 于 资源 访问 的 竞争 请 求 中 来 进行 选择 。 

Ada 任 务 的 形式 ， 与 Ada 中 的 包 的 形式 相 类 似 。 任 务 也 具有 两 个 部 分 ， 即 说 明 部 分 和 体 部 分 ， 
两 者 都 具有 相同 的 名 字 。 任 务 的 接口 就 是 它 的 入 口 点 ， 这 些 接口 即 是 能 够 接收 来 自 其 他 任务 的 
消息 的 位 置 。 可 以 十 分 自然 地 将 入 口 点 列 在 任务 的 说 明 部 分 中 。 因 为 会 合 涉及 数据 的 交换 ， 消 
息 可 以 具有 参数 ;， 因 此， 任务 的 入 口 点 也 必须 允许 参数 ， 这 些 参数 被 描述 在 说 明 部 分 。 在 外 观 
上 ， 任 务 的 说 明 与 包 中 的 抽象 数据 类 型 的 说 明 非 常 类 似 。 

考虑 下 面 代码 中 的 Ada 任 务 说 明 的 示例 ， 这 个 任务 包括 一 个 被 命名 为 Entry_1 的 入 口 点 ， 
它 有 具有 一 个 输入 型 的 参数 : 


task Task Example is 
entry Entry l(Item : in Integer); 
end Task Example; 


任务 体 中 必须 包括 入 口 点 的 某 种 语法 形式 ， 而 人 口 点 则 必须 与 任务 说 明 中 的 entzy 子 句 相 
对 应 。 在 Ada 中 ， 这 些 是 由 accept 子 句 来 说 明 ; 这 种 说 明 由 保留 字 accept 所 引出 。 一 个 
accept 子 句 是 一 个 语句 系列 ， 它 起 始 于 保留 字 accept， 终止 于 匹配 的 保留 字 end。accept 
子 名 本身 相 对 简单 ， 但 是 这 些 子 句 所 财 入 的 其 他 结构 就 可 能 相当 地 复杂 。 简 单 的 accept 子 名 
有 着 下 面 的 形式 : 

accept 入 口 _ 名称 ( 形 参 ) do 

end 入 口 _ 名 称 ; 

accept 的 名 字 与 相关 任务 的 说 明 部 分 中 的 一 条 entry 子 句 中 的 名 字 相 匹配 。 可 选 参 数 提供 
调用 任务 与 被 调用 任务 之 间 的 数据 通讯 方式 。 在 do 与 end 之 间 的 语句 则 定义 了 将 在 会 合 期 间 发 
生 的 操作 。 这 些 语句 一 起 被 称 为 accept 子 句 体 。 在 实际 的 会 合 期 间 ， 发 送 者 任务 被 悬挂 起 来 。 

在 任何 时 刻 ， 当 一 个 accept 子 句 接收 到 一 条 由 于 某 种 原因 而 没有 准备 接收 的 消息 时 ， 发 送 
者 任务 就 必须 被 悬挂 起 来 ， 直 到 接收 者 任务 已 经 准备 好 了 来 接收 这 条 消息 时 为 止 。 当 然 ， 入 口 
尽 也 必须 记 住 这 些 没有 被 接收 的 消息 的 发 送 者 任务 。 为 了 这 个 目的 ， 任 务 中 的 每 一 个 accept 子 
句 都 有 一 个 与 它 相 关联 的 队 ， 这 个 队 记 录 下 不 成 功 地 试图 与 这 个 任务 通讯 的 其 他 的 任务 。 

下 面 是 在 前 面 给 出 了 说 明 的 任务 的 任务 体 框架 : 

task body Task Example is 

begin 


loop 
accept Entry 1(Item : in Integer) do 


end Entry 1; 
end loop; 
end Task Example; 
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这 个 任务 体 中 的 accept 子 句 是 任务 说 明 中 被 命名 为 Entry-1 的 entry 的 实现 。 如 果 在 任何 
其 他 的 任务 发 送 一 条 消息 给 Entry_1 之 前 ，Task_Example 就 开始 了 执行 ， 并 且 达 到 了 accept 
接受 子 句 的 Entry_1 时 ，Task_Example 将 被 悬挂 起 来 。 如 果 当 Task_Examp1le 被 悬挂 在 
accept 子 句 之 时 ， 另 外 的 一 个 任务 发 送 一 条 消息 给 Entry_1， 这 时 将 发 生 一 个 会 合 ， 并 且 将 执 
行 这 一 条 accept 子 句 的 体 。 此 后 ， 因 为 体 中 的 循环 ， 执 行将 再 一 次 达到 accept 子 句 。 此 时 ， 
如 果 没 有 其 他 的 任务 再 发 送 消 息 给 Entry_1， 执 行将 再 一 次 被 暂停 ， 以 等 待 下 一 条 消息 的 到 来 。 

在 这 个 简单 的 示例 中 ， 会 合 能 够 以 两 种 基本 的 方式 发 生 。 第 一 种 ， 接 收 者 任务 ，Task_Exa- 
mple 可 能 正在 等 待 另外 一 个 任务 发 送 消 息 给 入 口 Entry 1。 当 消息 被 发 送 时 会 合 就 发 生 。 这 就 
是 上 面 所 摘 述 的 情形 。 第 二 种 ， 当 另外 一 个 任务 试图 发 送 一 条 消息 给 相同 的 入 口 时 ， 接 收 者 任 
务 可 能 正 忙碌 于 一 个 会 合 ， 或 忙碌 于 与 会 合 无 关 的 其 他 的 一 些 处 理 。 在 这 种 情况 下 ， 发 送 者 就 
被 悬挂 起 来 ， 直 到 接收 者 可 以 在 一 个 会 合 中 接收 那 一 条 消息 为 止 。 如 果 接 收 者 任务 正 忙于 一 个 
会 合 时 ， 送 来 了 几 条 消息 ， 则 发 送 者 都 被 放 入 队 之 中 进行 等 待 。 

图 13-3 中 用 时 间 线 图 形 来 说 明 这 两 种 会 合 。 


等 待 accept Accept 等 待 accept 
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CC 
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b) Sender 等 待 Task Example 
图 13-3 与 Task Example 会 合 的 两 种 方式 


一 个 任务 并 不 一 定 需 要 有 入 口 点 。 我 们 将 没有 入 口 点 的 任务 称 为 施 动 者 任务 (actor task), 
因为 这 种 类 型 的 任务 并 不 需要 等 竺 会合， 然后 才 进 行 它们 的 工作 。 施 动 者 任务 能 够 通过 给 其 他 
的 任务 发 送 消息 来 与 其 他 的 任务 相 会 合 。 与 施 动 者 任务 不 同 的 另外 一 种 任务 ， 则 可 以 具有 
accept 子 句 ， 但 是 在 accept 子 句 的 外 面 没 有 其 他 的 代码 ， 所 以 它 仅仅 是 对 于 其 他 的 任务 作出 
反应 。 我 们 将 这 样 的 任务 称 为 服务 者 任务 (server task)。 

一 个 给 另外 一 个 任务 发 送 一 条 消息 的 Ada 任 务 ， 必 须知 道 接受 消息 的 任务 中 入 口 点 的 名 称 。 
然而 反 过 来 则 不 成 立 : 一 个 任务 的 入 口 点 并 不 需要 知道 将 发 送 消息 给 它 的 那些 任务 的 名 称 。 这 
种 不 对 称 性 与 CSP (Communicating Sequential Processes) (Hoare, 1978) 语言 的 设计 正好 相反 。 
CSP 也 使 用 消息 传递 的 并 发 模型 。 然 而 在 CSP 中 ， 任 务 只 接收 来 自 被 明确 命名 的 任务 的 消息 。 
这 种 方法 的 缺点 是 不 能 够 建造 通用 的 任务 库 。 
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子 名 
图 13-4 任务 A 发 送 一 条 消息 给 任务 B 的 会 合 的 图 形 表示 


Ada 中 的 任务 是 具有 类 型 的 ， 并 且 可 以 是 匿名 的 或 者 是 命名 的 。 一 个 具有 命名 类 型 的 Ada 
任务 ， 可 以 通过 使 用 new 操 作 符 被 动态 地 创建 ， 并 且 可 以 通过 使 用 指针 来 引用 这 个 任务 。 例 如 ， 
考虑 下 面 的 任务 

task type Buffer is 

entry Deposit(Value : in Integer); 
entry Fetch(Value : out Integer); 


end; 
type Buf Ptr is access Buffer; 


任务 体 







Buf : Bur Ptr? 

Buf := new Buffer; 

将 任务 声明 于 包 、 子 程序 或 块 中 的 声明 部 分 。 静 态 创建 的 任务 与 带 有 声明 部 分 的 代码 语 名 
同时 开始 执行 。 例 如 ， 一 个 在 主 程序 中 声明 的 任务 与 主 程序 的 代码 体 中 的 第 一 条 语句 被 同时 地 
开始 执行 。 使 用 new 操 作 符 创建 的 任务 则 被 立刻 开始 执行 。 任 务 的 终止 是 一 个 复杂 的 过 程 ， 我 
们 将 在 本 小 节 的 稍 后 部 分 进行 讨论 。 

任务 可 能 具有 任意 多 个 入 口 。 任 务 中 相关 的 accept 子 句 所 出 现 的 次 序 将 决定 接收 消息 的 
次 序 。 如 果 一 个 任务 具有 多 个 人 口 点 ， 而 且 这 些 入 口 可 以 按照 任意 的 次 序 来 接收 消息 ， 那 么 这 
个 任务 将 使 用 一 条 select 语 句 来 包括 这 些 和 人 口 。 例 如 ， 假 设 把 银行 柜员 活动 的 任务 模型 化 ， 
柜员 必须 为 银行 内 的 走 入 站 台 (walk-up station) 的 顾客 服务 ， 还 要 为 免 停 窗口 (drive-up 
window) 的 顾客 服务 。 下 面 的 柜员 任务 框架 列 出 了 一 个 select 结 构 ; 


task body Teller is 
loop 
select 
accept Drive Up( formal parameters) do 


end Drive Up; 


or 
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accept Walk Up(formal parameters) do 
end Walk Up; 


at olot 
end loop; 

end Teller; 

这 个 任务 中 包括 了 两 条 accept 子 句 ，Walk_Up 和 Drive_Up; 每 一 条 accept 子 句 都 具有 一 
个 相关 的 队 。 当 执行 这 个 任务 时 ， 其 中 包含 的 select 语 句 的 行动 是 检查 与 这 两 条 accept 子 名 
相关 联 的 队 。 如 果 其 中 的 一 个 队 为 空 ， 但 在 另外 的 一 个 队 中 至 少 包含 了 一 条 在 等 候 的 消息 ( 顾 
客 )， 与 这 条 在 等 候 的 消息 相关 联 的 accept 子 句 就 将 与 发 送 所 收 到 的 第 一 条 消息 的 任务 进行 会 
合 。 如 采 这 两 个 与 accept 子 句 相 关 的 队 都 是 为 空 的 话 ，select 语 句 将 继续 等 修 ， 直 到 入 口 之 
一 被 调用 为 止 。 如 果 与 这 两 条 accept 子 句 相关 联 的 队 都 是 非 空 的 话 ， 两 条 accept 子 句 中 的 一 
条 将 被 非 确定 性 地 选择 ， 来 与 它 的 一 个 发 送 者 进行 会 合 。 循 环 将 迫使 select 语 句 永远 地 重复 
执行 。 

accept 子 句 的 end 语 句 标志 着 对 于 accept 子 句 中 的 形 参 赋值 的 代码 或 引用 的 代码 之 结束 ， 
在 accept 子 句 与 下 一 条 or 语句 之 间 ， 或 者 在 accept 子 名 与 下 一 条 end select 语 句 之 间 (4 
这 一 条 accept 子 句 在 select 中 是 最 后 一 条 accept 子 句 时 ) 如果 存在 代码 段 ， 这 段 代 码 就 被 
称 为 扩展 的 accept 子 句 。 扩 展 的 accept 子 句 只 有 在 相关 的 ( 它 所 紧 跟 的 ) accept 子 句 被 执行 
之 后 才能 够 被 执行 。 扩 展 的 accept 子 名 之 执行 不 是 会 合 中 的 部 分 ， 因 而 扩展 的 accept 子 句 能 
够 与 调用 任务 并 行 地 执行 。 发 送 者 在 会 合 期 间 被 悬挂 起 来 ， 但 是 当 执行 到 达 accept 子 句 的 尾 
部 时 ， 发 送 者 任务 又 被 重新 地 启动 ( 放 回 到 就 绪 队 之 中 ) 。 如 果 一 条 accept 子 句 没有 形 参 ， È 
就 不 需要 do-end 语 句 ， 可 以 仅仅 由 扩展 的 accept 子 句 来 组 成 accept 子 句 。 这 样 的 accept 子 
名 就 只 能 够 用 于 同步 。 第 13.6.3 节 将 说 明 Buf_Task 任 务 中 的 扩展 accept 子 句 。 


13.6.2 合作 同步 


每 一 条 accept 子 句 都 可 以 具有 一 个 附属 的 守卫 ， 以 用 于 延迟 会 合 ， 这 种 守卫 的 形式 为 一 
种 when 子 句 。 例 如 ; 


when not Full(Buffer) => 
accept Deposit(New Value) do 


一 条 与 when 子 句 连接 在 一 起 的 accept 子 句 ， 或 者 是 开放 的 或 者 是 关闭 的 。 如 采 when 子 名 
的 布尔 表达 式 为 真 ， 这 时 的 accept 子 句 就 被 称 为 开放 的 (open) ， 如 采 布 尔 表 达 式 为 假 的 话 ， 
这 时 的 accept 子 句 就 被 称 为 关闭 的 (closed) 。 一 条 没有 守卫 的 accept 子 句 总 是 开放 的 。 可 以 
将 一 条 开放 的 accept 子 句 用 于 会 合 ， 而 一 条 关闭 的 accept 子 句 则 不 能 会 合 。 

假设 在 一 条 select 语 句 中 包含 了 几 条 守卫 的 accept 子 句 。 通 前 是 将 这 种 select 子 句 放 
置 于 无 限 循环 之 中 。 这 种 循环 将 使 得 select 子 句 被 重复 执行 ， 而 在 每 一 次 的 重复 中 都 对 每 一 
条 when 子 句 进行 求 值 。 每 一 次 重复 都 构造 出 一 串 开 放 accept 子 句 。 如 果 在 这 些 开放 的 子 句 中 ， 
正好 只 有 唯一 的 一 条 子 句 具有 一 个 非 空 的 队 ， 束 从 这 个 队 中 取出 一 条 消息 来 进行 会 合 。 如 果 在 
多 条 开放 的 子 句 中 都 具有 非 空 的 队 ， 则 非 确 定性 地 选择 一 个 队 ， 并 从 这 个 队 中 取出 一 条 消息 来 
进行 会 合 。 如 果 所 有 开放 子 句 的 队 都 是 为 空 ， 任 务 就 将 等 待 下 一 条 消息 到 达 ， 然后 再 进行 会 合 。 
如 采 已 经 执行 了 一 条 select 语 句 ， 但 所 有 的 accept 子 句 都 是 关闭 的 ， 就 会 产生 一 个 运行 时 的 
异 第 或 错误 。 如 果 总 是 使 得 when 子 句 为 真 ， 或 者 是 在 select 语 句 中 增加 一 条 else 子 句 ， 就 能 
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够 避免 出 现 异常 的 可 能 性 。else 子 句 能 够 包括 除了 accept 子 句 以 外 的 任何 语句 序列 。 
select 子 句 也 可 以 具有 一 条 特殊 的 语句 terminate 语 句 ， 只 有 当 terminate 语 句 为 开放 
的 ， 并 且 没 有 其 他 的 accept 子 句 为 开放 的 情况 下 ， 才 能 够 选择 terminate 语 句 。 而 当选 择 了 


terminate 子 名 时， 就 意味 着 任务 已 经 完成 了 工作 ,但 还 没有 被 终止 。 我 们 将 在 本 节 稍 后 部 分 


讨论 任务 的 终结 。 
13.6.3 竞争 同步 


到 目前 为 止 ， 我 们 描述 了 提供 合作 同步 以 及 任务 之 间 通 讯 的 语言 特性 。 下 面 ， 我 们 将 讨论 
在 Ada 中 如 何 来 保证 对 于 共享 数据 结构 的 互 斥 访问 。 

如 霖 需要 由 一 个 任务 来 控制 存 取 一 个 数据 结构 ， 那 么 通过 在 任务 中 声明 这 个 数据 结构 ， 就 
能 够 获得 互 斥 访问 。 因 为 在 任 一 给 定 的 时 刻 ， 任 务 中 只 能 够 存在 一 条 活跃 的 accept 子 句 ， 因 
向 ， 任 务 执 行 的 语义 通常 就 保证 了 对 于 结构 的 互 斥 访问 。 这 种 情形 的 唯一 的 一 种 例外 ， 发 生 于 
当 任 务 被 戏 套 于 过 程 之 中 ， 或 者 是 被 嵌 套 于 其 他 的 任务 之 中 时 。 例 如 ， 如 果 有 一 个 定义 了 共享 
数据 结构 的 任务 ， 这 个 任务 中 又 艇 套 了 另外 一 个 任务 ， 被 从 套 的 这 个 任务 也 可 以 访问 共享 数据 
结构 ， 这 将 破坏 数据 的 完整 性 。 因 此 ， 控 制 对 于 共享 数据 访问 的 任务 中 ， 就 不 应 该 再 定义 其 他 
的 任务 。 

下 面 的 例子 ， 是 给 缓冲 区 提供 管 程 的 一 个 Ada 任 务 。 这 个 缓冲 区 与 我 们 在 13.3 节 中 讨论 的 组 
冲 区 的 例子 非常 相似 。 在 那个 缓冲 区 中 是 使 用 信号 量 来 控制 同步 。 

task Buf Task is 

entry Deposit(Item : in Integer); 


entry Fetch(Item : out Integer); 
end Buf Task; 


task body Buf Task is 


Bufsize : constant Integer := 100; 
Buf : array (1..Bufsize) of Integer; 
Filled : Integer range 0..Bufsize := 0; 
Next_In, 
Next_Out : Integer range 1..Bufsize := 1; 
begin 
loop 

select 


when Filled < Bufsize => 
accept Deposit(Item : in Integer) do 
Buf (Next In) := Item; 
end Deposit; 
Next_In := (Next_In mod Bufsize) + 1; 
Filled := Filled + 1; 
or 
when Filled > 0 => 
accept Fetch(Item : out Integer) do 
Item := Buf(Next Out); 
end Fetch; 
Next_Out := (Next_Out mod Bufsize) + 1; 
Filled := Filled - 1; 
end select; 
end loop; 
end Buf Task; 


这 个 例子 中 的 两 条 accept 子 名 都 是 扩展 的 。 这 两 条 扩展 的 accept 子 名 可 以 与 调用 它们 的 
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任务 并 发 地 执行 。 
使 用 Buf_Task 的 生产 者 任务 和 消费 者 任务 ， 可 以 具有 下 面 的 形式 : 


task Producer; 
task Consumer; 
task body Producer is 
New Value : Integer; 
begin 
loop 
-- 产生 New_Value -- 
Buf_Task.Deposit(New_ Value) ; 
end loop; 
end Producer; 


task body Consumer is 
Stored Value : Integer; 
begin 
loop 
Buf Task.Fetch(Stored Value); 
-- 消费 Stored Value -- 
end loop; 
end Consumer; 


13.6.4 任务 终结 


我 们 现在 来 讨论 任务 终结 的 问题 。 首 先 必 须要 定义 任务 的 完成 。 如 果 控 制 达 到 任务 体 代码 
的 结尾 ， 任 务 就 完成 了 。 当 提出 了 异常 然而 没有 相应 的 异常 处 理 程序 时 ， 也 称 为 任务 完成 了 。 
(关于 Ada 中 的 异常 处 理 将 在 第 14 章 描述 。) 如 采 一 个 任务 没有 创建 任何 其 他 的 被 称 为 依靠 者 的 
任务 ， 当 这 个 任务 的 执行 完成 时 任务 即 终 结 。 如 采 一 个 任务 产生 了 其 他 的 依靠 者 任务 ， 当 这 
个 任务 的 代码 执行 完成 时 ， 并 且 当 它 的 所 有 依靠 者 任务 都 终结 时 ， 这 个 任务 才 终 结 。 一 个 任 
务 可 以 通过 在 一 条 开放 的 tezminate 子 句 等 候 结 束 它 的 执行 。 在 这 种 情况 下 ， 只 有 当 一 个 任 
务 的 主人 (创建 它 的 块 、 子 程序 或 任务 ) 已 经 完成 ， 并 且 所 有 依靠 于 这 个 主人 的 任务 或 者 已 
经 完成 ， 或 者 正在 等 候 一 个 开放 的 terminate 子 句 时 ， 这 个 任务 才 终 结 。 在 这 种 情况 下 ， 所 
有 的 这 些 任务 同时 终结 。 一 个 块 或 一 个 子 程序 ， 需 要 等 到 它 的 所 有 依靠 者 任务 都 终结 时 ， 才 
能 够 退出 。 


13.6.5 优先 级 


可 以 给 命名 的 类 型 以 及 匿名 的 类 型 赋予 优先 级 。 这 是 通过 pragma 语句 来 完成 : 

pragma Priority (表达 式 )，; 

这 里 表达 式 的 值 说 明 任 务 的 相对 优先 级 ， 或 者 是 任务 所 属 类 型 定义 的 相对 优先 级 。 优 先 级 
的 可 能 值 范 围 取决 于 具体 的 实现 。 最 高 优先 级 可 以 用 priority 类 型 的 最 后 一 个 属性 来 说 明 ， 
priority 类 型 被 定义 于 System 中 《System 是 一 个 预定 义 的 包 ) 。 例 如 ， 下 面 的 表达 式 说 明 
任何 实现 中 的 最 高 优先 级 : 


pragma Priority (System.Priority 的 最 后 一 个 属性 ) ; 


当 目 前 执行 的 任务 被 阻塞 ， 或 用 完 分 配 时 间 ， 或 完成 执行 而 赋予 其 他 任务 优先 级 时 ， 决 定 
从 准备 好 的 队列 中 选择 任务 的 任务 表 使 用 这 些 。 而 且 ， 如 比 当前 正在 执行 的 任务 优先 级 更 高 的 
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任务 进入 准备 好 的 任务 队列 ， 那 么 它 抢占 正在 执行 的 低 优先 级 任务 而 执行 自己 (如 果 它 刚才 已 
经 在 执行 则 重新 启动 执行 )。 被 抢占 的 任务 离开 处 理 器 并 将 其 放置 到 准备 好 的 任务 列表 中 。 


13.6.6 二 元 信号 量 


如 采 要 控制 对 于 一 种 数据 结构 的 访问 ， 并 且 这 个 数据 结构 没有 被 封装 在 一 个 任务 中 ， 那 么 
束 必 须 使 用 其 他 的 方法 来 提供 互 斥 访 问 。 一 种 方法 ， 是 建立 一 个 二 元 信号 量 任务 ， 将 这 个 任务 
与 要 引用 该 数据 结构 的 任务 一 起 来 使 用 。 这 样 的 一 个 二 元 信号 量 任务 可 以 被 定义 如 下 ; 
这 个 任务 的 目的 是 要 保证 Wait 与 Release 操 作 以 交替 的 方式 来 进行 。 
task Binary Semaphore is 
entry Wait; 
entry Release; 
end Binary Semaphore; 


task body Binary Semaphore is 
begin 
loop 
accept Wait; 
accept Release; 
end loop; 
end Binary Semaphore; 


当 仅仅 是 为 了 同步 的 目的 来 传递 Ada 中 的 消息 ， 而 并 非 是 传递 数据 时 。 这 种 Binary 
Semaphore 任 务 显示 了 简化 的 可 能 性 特别 需要 注意 的 是 ， 这 种 不 需要 体 的 accept 子 句 的 简单 
形式 。 

使 用 Binary_semaphore 任 务 来 提供 对 一 个 共享 数据 的 互 斥 访问 ， 可 以 如 我 们 曾经 在 
13.3 中 的 例子 程序 中 所 使 用 的 信号 量 一 样 来 进行 。 当 然 ， 信 号 量 的 这 种 用 法 也 具有 曾经 在 本 
章 中 讨论 过 的 所 有 潜在 问题 。 

像 信号 量 的 情形 一 样 ， 也 可 以 使 用 Ada 中 的 任务 功能 来 模拟 管 程 。 任 务 完全 能 够 像 管 程 一 
样 来 提供 隐 式 的 互 斥 访问 。 因 而 ，Ada 的 任务 模型 同时 支持 信号 量 和 管 程 。 


13.6.7 受 保护 的 对 象 


正如 我 们 已 经 看 到 的 ， 通 过 将 共享 数据 包含 于 任务 中 ， 并 且 只 允许 通过 任务 入 口 的 访问 来 
控制 对 于 共享 数据 的 访问 。 任 务 的 入 口 隐 式 地 提供 竞争 同步 。 然 而 ， 使 用 这 种 方法 的 一 个 的 问 
题 征 ， 它 很 难 实现 高 效率 的 会 合 机 制 。Ada 95 中 的 受 保护 对 象 是 另外 一 种 提供 竞争 同步 的 可 能 
的 方法 ， 而 且 这 种 方法 并 不 需要 涉及 会 合 。 

受 保护 的 对 象 不 是 任务 ， 它 更 像 在 13.4 小 节 中 描述 的 管 程 。 受 保护 的 对 象 能 够 通过 受 保护 
的 子 程序 或 任务 中 语句 构造 上 与 accept 子 句 相似 的 入 口 来 进行 访问 。9 受 保护 对 象 的 入 口 与 任 
务 的 入 口 相 类 似 。 受 保护 的 子 程序 可 以 是 保护 的 过 程 或 受 保护 的 函数 ， 前 者 给 受 保护 对 象 的 数 
据 提 供 互 斥 的 读 写 访问 ， 而 后 者 给 这 些 数 据 提供 并 发 的 只 读 访 问 。 在 受 保护 的 过 程 体 中 ， 包 含 
了 受 保护 的 程序 单位 的 当前 实例 ， 被 定义 为 变量 。 而 在 受 保护 的 函数 体 中 ， 包 含 受 保护 的 程序 
单位 的 当前 实例 则 被 定义 为 常量 。 这 种 常量 允许 并 发 的 只 读 访问 。 

当 一 个 或 多 个 任务 使 用 同一 个 受 保护 的 对 象 时 ， 专 门 为 这 个 受 保护 对 象 的 入口 调用 提供 了 
同步 通讯 。 这 种 入 口 调 用 所 提供 的 访问 ， 类 似 于 对 于 包含 在 任务 中 的 数据 的 访问 。 


日 ” 受 保护 对 象 体 的 入 口 使 用 保留 字 entry， 而 不 是 在 任务 体 中 使 用 的 accept。 
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在 前 一 市 中 使 用 任务 来 解决 的 缓冲 区 问题 ， 也 可 以 通过 使 用 受 保护 的 对 象 来 解决 ， 后 一 种 
方法 还 更 为 向 便 。 注 意 ， 这 个 例子 不 包括 受 保护 的 子 程序 。 


protected Buffer is 
entry Deposit(Item : in Integer); 
entry Fetch(Item : out Integer); 


private 
Bufsize : constant Integer := 100; 
Buf : array (1..Bufsize) of Integer; 
Filled : Integer range 0..Bufsize := 0; 
Next_In, 
Next Out : Integer range 1..Bufsize := 1; 


end Buffer; 


protected body Buffer is 
entry Deposit(Item : in Integer) when Filled < Bufsize is 


begin 
Buf (Next In) := Item; 
Next_In := (Next_In mod Bufsize) + 1; 
Filled := Filled + 1; 
end Deposit; 
entry Fetch(Item : out Integer) when Filled > 0 is 
begin 
Item := Buf(Next_ Out); 
Next Out := (Next Out mod Bufsize) + 1; 
Filled := Filled - 1; 
end Fetch; 
end Buffer; 


13.6.8 异步 消息 传递 


到 目前 为 止 ， 在 这 一 节 中 所 描述 的 会 合 机 制 都 是 严格 同步 的 ， 并 且 在 实际 通过 会 合 来 进 和 
通讯 前 ， 发 送 者 和 接收 者 都 必须 就 绪 。 

一 个 任务 可 以 具有 一 条 特殊 的 select 子 句 ， 被 称 为 异步 select 子 句 。 这 种 子 名 能够 对 来 
日 其 他 任务 的 消息 立刻 作出 反应 。 它 可 以 具有 两 种 不 同 触发 机 制 中 的 一 种 ， 入 口 调用 或 是 一 条 
delay 语 句 。 在 异步 select 子 句 中 ， 除 了 触发 部 分 外 ， 还 具有 可 中 止 的 部 分 ， 可 中 止 的 部 分 
可 以 包含 任意 的 Ada 语 句 序列。 异步 select 子 句 的 语义 是 只 能 够 执行 这 种 子 句 中 两 个 部 分 之 一 ， 
如 采 触 发 事件 发 生 (或 者 是 接收 到 一 个 entry 调 用 ,或 者 delay 定 时 器 终止 )， 将 执行 触发 部 
分 ; 否则 ， 则 执行 可 中 止 部 分 。 下 面 异步 select 子 句 的 两 个 示例 ， 来 自 Ada 95 参 考 手册 
(ARM，1995)。 在 第 一 段 代码 中 ， 可 中 止 子 句 被 重复 执行 (因为 是 在 循环 中 )， 直 至 接收 到 一 
个 调用 ，Terminal.Wait For_Interrupt。 在 第 二 段 代码 中 ， 可 中 止 子 句 所 调用 的 函数 至 
少 运 行 五 秒 钟 。 如 果 到 时 候 它 还 没有 结束 ，select 子 句 将 退出 。 


-=- 用 于 命令 解释 器 的 主 命令 循环 
loop 
select 


Terminal.Wait For Interrupt; 
Put Line("Interrupted"); 
then abort 
-一旦 终 止 介入 这 部 分 将 被 删除 
Put Line("-> "); 
Get Line(Command, Last); 
Process Command(Command (1..Last)); 
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end select; 
end loop; 


-- 时间 限制 的 计算 
select 
delay 5.0; 
Put Line("Calculation does not converge"); 
then abort 
-- 计算 应 该 在 五 秒 钟 内 完成 ， 如 果 五 秒 钟 还 没有 完成 计算 ， 即 假设 发 散 
Horribly Complicated Recursive Function(X, Y); 
end select; 


13.6.9 评估 


使 用 一 般 消 息 传 递 并 发 模型 来 构造 管 程 ， 就 像 使 用 Ada 的 程序 包 来 支持 抽象 数据 一 样 一 这 
两 者 较 之 所 要 解决 的 特殊 问题 ， 都 是 通用 得 多 的 工具 。 受 保护 的 对 象 是 提供 同步 共享 数据 的 一 
种 优 民 方 法 。 

在 不 具有 独立 存储 器 的 分 布 式 处 理 器 的 情况 下 ， 如 果 要 在 管 程 和 消息 传递 之 间 进 行 选择 ， 
以 便 挑 选 出 在 并 发 环境 中 实现 共享 数据 的 一 种 方式 ， 就 仅仅 是 根据 人 们 各 自 的 喜好 。 然 而 ， 在 
Ada 中 使 用 受 保护 的 对 象 来 支持 对 共享 数据 的 访问 则 显然 是 一 种 更 佳 的 方式 。 这 种 方法 不 仅 在 
于 代码 简单 ， 它 的 效率 也 要 高 很 多 。 

对 于 分 布 式 系统 ， 消 息 传递 是 一 种 较 好 的 并 发 模型 ， 因 为 它 自然 地 支持 在 分 离 处 理 器 上 并 
行 运行 分 离 程序 的 概念 。 


13.7 _ Java 线程 


Java 中 的 并 发 单位 是 一 种 被 称 为 run 的 方法 ，run 方 法 的 代码 可 以 与 其 他 对 象 的 相同 方法 以 
及 main 方 法 被 并 发 地 执行 。 执 行 run 方 法 的 进程 被 称 为 线程 (thread) 。Java 的 线程 是 轻 任务 ， 
这 意味 着 这 些 线程 都 运行 于 同一 个 地 址 空间 中 。 这 就 与 Ada 中 的 任务 不 同 ，Ada 的 任务 是 重任 务 ， 
它们 都 分 别 运 行 于 自己 的 地 址 空间 之 中 。 一 个 十 分 重要 的 结果 就 是 ，Java 的 线程 比 Ada 中 的 任务 
所 需要 的 代价 小 得 多 。 

存在 着 可 以 被 用 来 定义 具有 run 方 法 的 类 对 象 的 两 种 方式 。 其 中 的 一 种 方式 是 定义 预定 义 
类 Thread 的 一 个 子 类 ， 并 重新 编写 这 个 子 类 的 run 方 法 。 然 而 ， 如 果 这 个 新 的 子 类 具有 一 个 必 
定 的 自然 父 类 ， 那 么 将 它 定义 为 ?phread 的 子 类 显然 是 不 行 的 。 在 这 种 情况 下 , 我 们 将 定义 一 个 
类 来 继承 它 的 自然 父 类 ， 并 且 实 现 接口 Runnable。 接 口 Runnable 提 供 对 于 run 方 法 协议 的 支 
持 。 正 如 我 们 将 在 13.7.4 小 节 中 看 到 的 ， 使 用 这 种 方式 仍然 需要 一 个 rhread 对 象 ， 

正如 我 们 将 在 13.7.3 小 节 中 讨论 的 ， 能 够 使 用 Java 的 线程 来 实现 管 程 。 


13.7.1 Thread 类 


Thread 类 不 是 任何 其 他 类 的 自然 父 类 。Thread 类 对 它 的 子 类 提供 某 些 服务 ， 但 却 没 有 任 
何 目 然 的 方式 与 这 些 子 类 的 计算 目的 相关 联 。 然 而 : Thread 类 是 程序 人 员 唯 一 可 以 用 来 构造 并 
发 Java 程 序 的 类 。 正 如 在 前 面 曾经 提 到 的 ， 在 13.7.4 小 节 里 ， 我 们 将 简要 地 讨论 关于 Runnable 
接口 的 使 用 。 

Threadq 类 的 核心 是 被 称 为 run 和 stazt 的 两 个 方法 。 Run 方 法 总 是 被 Thread 类 的 子 类 所 
覆盖 。Run 方 法 中 的 代码 描述 线程 的 行为 。 Thread 类 的 start 方 法 通过 调用 它 的 run 方 法 将 它 
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的 线程 启动 为 一 个 并 发 单位 。e start 方 法 的 调用 不 同 于 通常 的 一 般 调用 ， 因 为 控制 即刻 就 返回 


到 了 调用 程序 ， 调 用 程序 将 接着 继续 它 的 执行 ， 与 新 启动 的 run 方 法 的 执行 相 并 行 。 
下 面 是 Thread 一 个 子 类 的 框架 和 一 段 代 码 。 这 段 代码 产生 这 个 子 类 的 一 个 对 象 并 在 这 个 


新 的 线程 中 开始 run 方 法 的 执行 : 
class MyThread extends Thread { 
public void run() { --- } 


} 


eod myTh = new MyThread(); 

myTh.start(); 

当 开 始 执行 一 个 Java 应 用 程序 (而 不 是 一 个 小 应 用 程序 applet) 时 ， 将 创建 一 条 新 的 线程 
(main 方 法 将 被 执行 于 这 一 条 新 线程 中 ) ， 并 且 调 用 main 方 法 。 小 应 用 也 都 运行 于 它们 的 线程 
之 中 。 因 此 ， 所 有 的 Java 程 序 都 被 执行 于 线程 之 中 。 

当 一 个 程序 具有 多 条 线程 时 ， 必 须 存在 一 个 调度 程序 来 决定 哪 一 条 或 是 哪 一 些 线程 将 在 任 
何 给 定时 刻 运行 。 在 大 多 数 情 况 下 只 有 一 个 处 理 器 ， 因 而 在 某 一 个 时 刻 只 有 一 条 线程 在 实际 运 
行 。 因 为 不 同 的 实现 (FEB, RE) 不 一 定 会 以 完全 相同 的 方式 来 调度 线程 ， 所 以 很 难 精确 
地 描述 Java 的 调度 程序 是 如 何 工作 的 。 然 而 典型 地 ， 只 要 所 有 的 线程 都 有 相同 的 优先 级 , 调度 程 
序 将 按照 轮流 的 方式 ， 给 予 每 一 个 可 运行 线程 同样 长 的 时 间 片 段 。 

Thread 类 提供 了 一 些 方法 来 控制 Thread 对 象 的 执行 。 不 具有 参数 的 Yield 方 法 ， 是 正在 
运行 的 线程 自动 放弃 处 理 器 的 请 求 。 这 一 条 线程 被 立刻 放置 于 任务 就 绪 队 之 中 ， 成 为 可 运行 线 
程 。 然 后 ， 调 度 程序 将 从 任务 就 绪 队 中 选择 出 最 高 优先 级 的 线程 。 如 果 其 他 可 运行 线程 的 优先 
级 ， 都 比 刚才 放弃 处 理 器 的 线程 低 ， 这 一 条 线程 就 成 为 下 一 个 得 到 处 理 器 的 线程 。 

sleep 方 法 只 具有 一 个 整数 参数 ， 这 个 参数 是 sleep 方 法 的 调用 程序 希望 阻塞 线程 运行 的 
毫秒 数 。 在 所 说 明 的 毫秒 时 间 后 ， 线 程 将 被 放置 于 任务 就 绪 队 中 。 因 为 无 法 确切 知道 究竟 一 个 
线程 在 被 执行 以 前 将 在 任务 就 绪 队 中 等 待 多 久 ，s1leep 的 参数 因而 就 是 线程 执行 前 的 最 少 等 符 
时 间 。sleep 方 法 能 够 抛 出 InterruptedException 异 常 ， 必 须 在 调用 sleep 的 方法 中 进行 
处 理 这 个 异常 。 关 于 异常 将 在 第 14 章 详细 拉 述 。 

使 用 join 方法 来 强迫 延迟 一 个 方法 的 执行 ， 直 到 另外 一 条 线程 的 run 方法 执行 完毕 为 止 。 
当 一 个 方法 的 执行 必须 等 待 另 外 一 条 线程 的 工作 完毕 后 才能 继续 时 , 就 可 以 使 用 join 方法 来 延 
迟 前 面 这 个 方法 的 执行 。 例 如 ， 我 们 可 以 有 下 面 的 fun 方法 : 


public void run() { 


Thread myTh = new Thread(); 


myTh.start(); 
// 进行 这 一 条 线程 的 部 分 的 计算 
myTh.join(); // 等 待 nyTh 的 完成 


// 进行 这 一 条 线程 的 剩余 部 分 的 计算 
} 
join 方法 将 调用 它 的 线程 设置 在 被 阻塞 的 状态 。 只 有 当 join 方 法 所 属 的 线程 完成 运行 时 ， 
这 种 状态 才能 够 终结 。 如 果 join 方 法 所 属 的 线程 恰好 也 被 阻塞 住 了， 就 有 产生 死 锁 的 可 能 。?> 
了 避免 死 锁 的 发 生 ， 可 以 使 用 一 个 参数 来 调用 join 方 法 。 这 个 参数 是 一 种 毫秒 时 间 限 制 ， 它 说 


O 直接 地 调用 zun 方 法 并 非 总 是 可 行 的 ， 其 中 的 原因 , 是 run 方 法 时 常 所 需要 的 初始 化 , 被 包括 在 了 start 方 法 之 中 。 
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明 调 用 线程 可 以 等 待 多 和 久 ， 以 便 被 调用 的 线程 能 够 完成 。 例 如 : 
myTh.join(2000); 


这 就 使 得 调用 线程 可 以 等 待 2 秒 钟 ， 以 便 myTh 得 以 完成 。 如 果 时 间 已 经 过 了 2 秒 钟 ， 但 
myTh 还 没有 完成 执行 ， 调 用 线程 将 被 放 回 就 绪 队 ， 这 意味 着 一 旦 被 调度 ， 这 一 条 线程 将 被 继续 
执行 下 去 。 

Java 早 期 的 版 本 曾经 包括 了 另外 的 三 种 Thread 方 法 ， 即 stop、suspend 和 resume 方 法 。 
因为 安全 方面 的 问题 ，Java 反 对 使 用 这 三 种 方法 。stop 方 法 时 常 被 一 种 简单 方法 所 覆盖 ， 这 种 
简单 方法 设置 它 的 引用 变量 为 nu11， 从 而 撤销 线程 。 

run 方 法 完成 执行 的 一 种 正常 方式 ， 是 达到 代码 的 结尾 。 然 而 ， 在 许多 情况 下 ， 线 程 在 运 
行 时 会 被 要 求 停止 。 这 就 存在 着 一 个 问题 ， 即 线程 怎样 决定 究竟 是 应 该 继续 执行 、 还 是 应 该 停 
止 执行 。interrupt 方 法 就 是 一 种 与 停止 的 线程 进行 通讯 的 方式 。 这 种 方法 并 不 直接 停止 线程 
的 执行 ， 它 仅仅 是 传送 一 条 消息 ， 这 条 消息 将 设 定 线 程 中 的 一 个 字 位 ， 而 线程 将 对 于 这 个 字 位 
进行 检测 。 用 于 这 种 检测 的 是 谓词 方法 isInterrupted。 这 并 不 是 一 种 完善 的 解决 方法 。 原 
因 是 当 调 用 interzupt 方 法 时 ， 将 要 被 中 断 的 线程 可 能 正 处 于 睡眠 或 等 待 的 状态 。 这 样 它 就 不 
会 去 检测 自己 是 否 已 经 被 中 断 了 。 为 了 对 付 这 些 情 况 ，interrupt 方 法 将 抛 出 一 个 
InterruptedException# Keke 〈 从 睡眠 或 等 待 的 状态 中 ) 唤醒 。 这 样 ， 线 程 就 可 以 
周期 地 检测 自己 是 否 已 经 被 中 断 了 和 如 果 被 中 断 了 ， 它 是 否 可 以 终止 。 由 于 当中 断 发 生 时 ， 如 
琳 线程 是 处 于 睡眠 或 等 待 的 状态 ， 它 会 被 中 断 所 唤醒 ， 因 而 线程 不 会 错过 中 断 。 实 际 上 ， 关 于 
interrupt 方 法 的 行动 及 其 使 用 还 存在 着 很 多 的 细节 ， 但 我 们 将 不 在 这 里 进行 讨论 (Arnold, et 
al., 2006 ) 。 


13.7.2 优先 级 


线程 的 优先 级 不 必 都 是 相同 的 。 一 个 线程 的 默认 优先 级 ， 与 创建 它 的 线程 的 优先 级 相同 。 
MIA main 产生 了 一 条 线程 ， 这 条 线程 的 默认 优先 级 是 常量 NORM_PRIORITY， 其 值 通常 是 5。 
Thread 还 定 义 了 两 个 其 他 的 优先 级 常量 ， MAX PRIORITY 和 MIN_PRIORITY， 其 值 通常 分 别 
为 10 和 1。 可 以 使 用 setPriority 方 法 来 改变 线程 的 优先 级 。 新 的 优先 级 可 能 是 任何 一 个 预定 
义 的 常量 ， 或 者 是 MIN_PRIORITY 和 MAX_PRIORITY 之 间 的 任何 其 他 的 数字 ，。 getPriority 
方法 返回 线程 的 当前 优先 级 。 

当 一 些 线程 具有 不 同 的 优先 级 时 ， 调 度 程序 的 行为 由 这 些 优先 级 来 控制 。 当 正在 执行 的 线 
程 被 阻止 或 删除 ， 或 者 是 时 间 片 段 被 使 用 完毕 时 ， 调 度 程 序 将 从 任务 就 绪 队 中 选择 具有 最 高 优 
先 级 的 线程 。 一 旦 有 了 运行 机 会 ， 只 有 当 较 高 优先 级 的 线程 不 在 任务 就 绪 队 中 时 ， 较 低 优先 级 
的 线程 才能 够 被 执行 。 


13.7.3 竞争 同步 


在 Java 中 实现 竞争 同步 的 办 法 ， 是 说 明 访问 共享 数据 的 一 个 方法 之 运行 、 完 成 于 另外 一 个 
相同 对 象 上 的 方法 的 执行 之 前 。 换 言 之 ， 我 们 能 够 说 明 一 旦 开始 执行 一 个 特定 的 方法 ， 在 任何 
其 他 的 方法 开始 在 相同 对 象 上 的 运行 之 前 ， 这 个 方法 将 完成 它 的 执行 。 这 种 方法 相当 于 在 对 象 
上 放置 了 一 把 锁 ， 从 而 阻止 其 他 同步 的 方法 在 同一 个 对 象 上 的 执行 。 可 以 通过 在 方法 的 定义 中 


O 不 同 的 实现 具有 不 同 的 优先 级 的 数目 。 所 以 在 一 些 实现 中 的 优先 级 数目 可 能 会 小 于 或 大 于 层次 10。 
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附加 synchronized 修 饰 符 来 说 明 ， 如 下 面 类 定义 的 框架 中 的 : 
class ManageBuf { 


private int [100] buf; 


public synchronized void deposit(int item) { ... } 
public synchronized int fetch() { ... } 


} i 
定义 在 ManageBuf 中 的 两 个 方法 都 被 定义 为 synchronized 的 ,这 就 能 够 阻止 这 两 个 方 
法 在 相同 对 象 上 执行 时 的 相互 干扰 ， 即 使 它们 是 由 不 同 的 线 所 调用 的 。 

如 果 一 个 对 象 的 所 有 方法 都 是 同步 的 ， 它 实际 上 就 是 一 个 管 程 。 请 注意 ， 一 个 对 象 可 能 具 
有 一 个 或 多 个 同步 的 方法 ， 也 可 能 会 具有 一 个 或 多 个 非 同步 的 方法 。 

有 时 ， 在 一 个 方法 中 对 于 共享 数据 进行 处 理 的 语句 数目 ， 大 大 少 于 其 他 的 语句 数目 。 这 时 ， 
最 好 是 仅仅 对 于 存 取 共 享 数据 的 代码 段 或 改变 共享 数据 的 代码 段 施行 同步 ， 而 不 是 对 于 整个 方法 
施行 同步 。 这 可 以 通过 使 用 所 谓 的 同步 语句 (synchronized statement) 来 说 明 ， 同 步 语句 的 一 般 形 
式 为 : 

synchronized (表达 式 ) 

语句 

这 里 的 表达 式 是 对 于 一 个 对 象 的 求 值 ， 而 语句 则 可 以 是 一 条 语句 ， 也 可 以 是 一 组 复合 语句 。 
在 这 一 条 语句 或 复合 语句 的 执行 期 间 ， 将 这 个 对 象 锁 住 。 从 而 这 条 语句 或 复合 语句 的 执行 ， 就 
完全 像 在 同步 的 方法 体 中 的 执行 一 样 。 

一 个 具有 同步 方法 的 对 象 必须 有 一 个 相关 的 队 。 当 一 个 方法 对 于 这 个 对 象 进行 操作 时 ， 其 
他 试图 对 于 这 个 对 象 进 行 操作 的 方法 ， 则 被 保存 在 这 个 队 中 。 当 一 个 同步 方法 完成 了 一 个 对 象 
上 的 执行 ， 如 果 这 个 队 不 为 空 ， 在 等 候 队 中 的 一 个 方法 将 被 放 入 任务 就 绪 队 中 去 。 


13.7.4 合作 同步 


Java 中 的 合作 同步 ， 由 0bject 类 中 定义 的 wait，notify 和 notifyAll 方 法 来 完成 。 
Object 类 是 所 有 Java 中 的 类 的 根 类 。 除 了 object 以 外 的 所 有 的 类 ， 都 继承 这 些 方法 。 每 一 个 
对 象 都 有 一 个 等 待 的 队列 ， 其 中 包含 调用 了 这 个 对 象 中 的 wait 方 法 的 所 有 的 线 。 使 用 notify 
方法 来 告诉 一 条 正在 等 待 的 线 ， 它 所 等 待 的 事件 已 经 发 生 了 。 究 竟 哪 一 条 线 是 由 notify 方 法 
来 唤醒 ， 是 不 能 确定 的 ， 因 为 Java 的 虚拟 机 器 (JVM) 从 等 待 的 列 中 挑选 出 一 条 线 往 往 是 随机 
的 。 正 是 出 于 这 种 原因 ， 还 由 于 在 等 待 的 线 都 是 各 自 等 待 着 不 同 的 条 件 ， 所 以 我 们 通常 是 使 用 
notifyRAl1 方 法 ， 而 不 是 notify 方 法 。notifyRAl1 方 法 唤醒 这 个 对 象 的 等 待 列 中 所 有 的 线 ， 
在 它们 调用 了 wait 方 法 后 即 开始 执行 。 

wait、notify 和 notifyAll 方 法 都 只 能 从 同步 的 方法 中 来 调用 ， 因 为 这 些 方法 使 用 了 由 
这 种 同步 方法 放置 在 对 象 上 的 锁 。 而 对 于 wait 的 调用 通常 是 放置 在 while 循 环 之 中 ;， 循环 的 控 
制 由 方法 所 等 待 的 条 件 来 实施 。 由 于 是 使 用 notifyAll 方 法 ， 其 中 有 一 些 线 可 能 自 上 一 次 测试 
后 已 经 将 条 件 改 为 了 false。 

wait 方 法 能 够 抛 出 InterzuptedException， 这 种 异常 是 Exception 的 一 个 后 裔 ( 关 
于 Java 中 的 异常 处 理 ， 我 们 将 在 第 14 章 中 讨论 ) 。 因 此 ， 任 何 调用 wait 的 代码 都 必须 捕捉 
InterLruptedException 异 省 。 假 设 我 们 所 等 待 的 条 件 是 thecondition， 传 统 的 使 用 
wait 的 方式 就 是 : 
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try { 

while (!theCondition) 

wait(); 

-- 在 条 件 theCcondition 为 真 之 后 ， 进 行 所 需要 的 任何 事情 
} 
catch(InterruptedException myProblem) { ... } 
下 面 的 程序 实现 存储 int 值 的 一 个 环形 队 。 这 个 程序 说 明 如 何 来 进行 合作 同步 与 竞争 同步 。 
// Queue 


// This class implements a circular queue for storing int 
// values. It includes a constructor for allocating and 
// initializing the queue to a specified size. It has 

// synchronized methods for inserting values into and 

// removing values from the queue. 


class Queue { 
private int [] que; 
private int nextIn, 
nextOut, 
filled, 
queSize; 


public Queue(int size) { 
que = new int [size]; 


filled = 0; 
nextIn = 1; 
nextOut = 1; 


queSize = size; 
} //** end of Queue constructor 


public synchronized void deposit (int item) { 


try { 
while (filled == queSize) 
wait(); 


que [nextIn] = item; 
nextIn = (nextIn % queSize) + 1; 
filled++; 
notifyAll(); 
} //** end of try clause 
catch(InterruptedException e) {} 
} //** end of deposit method 


public synchronized int fetch() { 
int item = 0; 


try { 
e while (filled == 0) 
wait(); 
item = que [nextOut]; 
nextOut = (nextOut % queSize) + 1; 
filled--; 


notifyAll(); 
} //** end of try clause 
catch(InterruptedException e) {} 
return item; 
} //** end of fetch method 
} //** end of Queue class 
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请 注意 ， 这 里 的 异常 处 理 程序 (catch) 并 不 做 任何 事情 。 
可 以 将 能 够 使 用 Queue 类 的 生产 者 和 消费 者 对 象 的 类 定义 如 下 : 


class Producer extends Thread { 
private Queue buffer; 
public Producer(Queue que) { 
buffer = que; 
} 
public void run() { 
int new_item; 
while (true) { 
//-- 产生 一 个 new_item 
buffer.deposit(new_item) ; 
} 
} 
} 


class Consumer extends Thread { 
private Queue buffer; 
public Consumer(Queue que) { 
buffer = que; 
} 
public void run() { 
int stored_item; 
while (true) { 
buffer.fetch(stored_ item); 
//-- 消费 stored_item 
} 
} 
} 


下 面 的 代码 创建 一 个 Queue 对 象 ， 还 产生 一 个 Producer 对 象 和 一 个 Consumer 对 象 ， 
Producer 对 和 象 与 Consumer 对 象 都 依附 于 Queue 对 象 ， 这 段 代 码 同时 也 开始 执行 Producer 与 
Consumer 对 人 象 。 


Queue buffl = new Queue(100); 

Producer producerl = new Producer (buff1); 
Consumer consumerl = new Consumer (buffl); 
producerl.start(); 

consumerl.start(); 


我 们 可 以 将 Producer 和 Consumer 中 的 一 个 或 是 这 两 个 对 象 ， 都 定义 成 为 Runnable 接 口 
的 实现 ， 而 不 是 定义 为 Thread 的 子 类 。 这 里 唯一 改变 了 的 是 第 一 行 ， 现 在 这 一 行 代码 将 成 为 : 


class Producer implements Runnable 


为 了 创建 并 且 运 行 这 个 类 对 象 ， 仍 然 需要 创建 一 个 连接 到 这 个 对 象 的 Thread 对 人 象 。 这 在 
下 面 的 代码 中 给 予 了 示范 : 
Producer producerl = new Producer (buffl); 


Thread producerThread = new Thread(producerl1); 
producerThread.start(); 


13.7.5 评估 


Java 对 于 并 发 的 支持 相对 简单 、 然 而 卓有成效 。 因 为 Ada 中 的 任务 是 重 线程 ， 从 而 容易 将 
Ada 的 任务 分 布 到 不 同 的 处 理 器 上 ;， 尤其 是 在 不 同 地 点 的 不 同 计算 机 中 、 具 有 不 同 存储 器 的 不 
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同 处 理 器 的 情形 。 不 可 能 将 Java 中 的 轻 线程 用 于 这 种 类 型 的 系统 。 
13.8 C# 线 程 


虽然 C# 中 的 线程 是 松散 地 基于 Java 的 线程 ， 但 二 者 之 间 却 有 着 重大 的 不 同 。 下 面 是 关于 C# 
中 的 线程 的 简略 概貌 。 


13.8.1 基本 线程 操作 


任何 C# 的 方法 都 可 以 被 执行 于 自己 的 线程 中 。 这 不 像 在 Java 中 ， 只 有 zun 方 法 可 以 执行 于 
自己 的 线程 中 。 一 个 C# 中 线程 是 通过 产生 一 个 Thread 对 象 从 而 产生 的 。 在 产生 Thread 对 象 时 ， 
必须 给 Thread 构 造 器 传送 一 个 预定 义 的 代表 类 Threadstart9 的 实例 ; 而 在 产生 
Threadstart 类 的 实例 时 ， 还 必须 给 Thread 构 造 器 传送 实现 线程 的 行动 。 例 如 ， 我 们 可 以 有 : 


public void MyRunl() {...} 


Tirei myThread = new Thread(new ThreadStart(MyRun1) ); 

如 同 在 Java 中 的 那样 ， 在 产生 了 一 条 线程 时 ， 并 不 开始 这 条 线程 的 并 发 执行 。 必 须 通过 一 
个 方法 来 请 求 执行 ， 在 这 里 的 情形 就 是 通过 start 方 法 。 例 如 : 

myThread.Start(); 


也 如 同 在 Java 中 的 那样 ， 可 以 让 一 条 线程 等 待 另 外 的 一 条 线程 完成 了 执行 后 ， 再 继续 这 条 
线程 的 执行 ， 这 也 是 通过 使 用 一 个 具有 类 似 名 称 的 方法 Join。 

也 可 以 使 用 Sleep 方法 将 一 条 线程 悬挂 一 定 的 时 间 。S1leep 方 法 是 Thread 类 中 的 一 个 公 
有 的 静态 方法 。Sleep 方 法 的 参数 是 为 整数 的 毫秒 数 。 与 在 Java 中 的 Sleep 方 法 不 同 的 是 ，C# 
中 的 Sleep 方 法 并 不 抛 出 任何 异常 ， 因 而 不 需要 将 它 在 try 程 序 块 中 调用 。 

还 可 以 使 用 Abort 方 法 来 终止 一 条 线程 。 然 而 在 实际 上 ，Abort 方 法 并 不 将 一 条 线程 处 
死 ， 它 仅仅 抛 出 线程 可 以 捕捉 的 ThreadAbortException 异 常 。 当 一 条 线 捕捉 到 了 这 个 异常 
后 ， 这 条 线程 通常 将 解除 自身 被 分 配 了 的 空间 ， 然 后 (到 代码 的 结尾 处 ) KE, 


13.8.2 线程 同步 


存在 着 三 种 不 同 的 方式 用 来 同步 C# 中 的 线程 ，Interlock 类 、lock 语 句 和 Monitor 类 ， 
每 一 种 机 制 都 设计 来 满足 不 同 的 需要 。Interlock 类 使 用 于 当 需 要 进行 同步 的 操作 仅仅 是 整数 
的 增 减 时 。 使 用 Interlock 类 的 两 个 方法 Increment 和 Decrement 来 进行 这 些 操作 。 这 两 种 
方法 将 接受 一 个 整数 引用 来 作为 参数 。 例 如 ， 如 果 要 在 一 条 线程 中 增加 共享 整数 counter 的 值 ， 
我 们 可 以 使 用 : 

Interlocked.Increment(ref counter) ; 

lock 语 句 被 用 来 在 线程 的 代码 中 标记 一 个 关键 段 。lock 语 句 的 文法 如 下 所 示 : 


lock (表达 式 ) { 
// 关键 段 
} 


这 里 的 表达 式 看 起 来 像 是 lock 的 参数 ， 但 实际 上 它 通常 是 对 于 线程 所 属 对 象 的 引用 ， 即 this， 


O 一 个 C# 中 的 代表 (delegate)， 是 一 个 函数 指针 的 面向 对 象 的 版 本 ， 在 这 里 的 情形 , 这 个 函数 指针 实际 上 指向 了 
我 们 想 要 在 新 线程 中 执行 的 方法 。 


Un 


Un 


Nn 
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Monitor 类 具有 着 4 个 方法 : Enter、Wait、Pulse 和 Exit。 这 些 方法 可 以 用 来 提供 更 为 
复杂 的 线程 同步 。Entez 方 法 将 接受 一 个 对 象 的 引用 来 作为 参数 ， 它 标志 这 个 对 象 的 线程 同步 的 
开始 .wait 方法 将 一 条 线程 的 执行 悬挂 起 来 , 并 且 指 示 .NET 的 Common Language Runtime (CLR); 
布 望 这 一 条 线程 能 够 在 下 次 有 机 会 时 恢复 执行 。Pulse 方 法 也 接受 一 个 对 象 的 引用 来 作为 参数 ， 
它 通知 那些 在 等 待 的 线程 它们 现在 已 经 有 机 会 再 次 运行 。 Pulse 方 法 类 似 于 Java 中 的 notifyAll， 
等 待 线程 的 运行 的 顺序 ， 是 按照 这 些 线程 调用 wait 方 法 的 次 序 来 进行 。Exit 方 法 将 结束 线程 的 
关键 段 。 


13.8.3 评估 


C# 中 的 线程 ， 是 从 先驱 语言 lava 中 的 线程 改进 而 来 。 任 何方 法 都 可 以 执行 于 自己 的 线程 之 
中 。C# 中 线程 的 终结 较为 简洁 (调用 方法 Abort 比 把 线程 指针 设置 为 空 更 优雅 )。 而 在 C# 中 线 
程 执行 的 同步 则 更 为 复杂 ， 因 为 C# 有 一 些 不 同 的 机 制 来 满足 不 同 的 应 用 。 与 Java 中 的 线程 一 样 ， 
C# 中 的 线程 是 轻 线 程 ， 因 而 它们 不 能 够 像 Ada 中 的 任务 那么 通用 。 


13.9 语句 层次 的 并 发 


在 这 一 市 里 ， 我 们 将 简略 描述 支持 语句 层次 并 发 的 语言 设计 。 从 语言 设计 的 角度 来 看 ， 这 
种 设计 的 目的 是 提供 一 种 机 制 ， 程 序 人 员 能 够 使 用 这 种 机 制 告 诉 编译 器 ， 怎 样 将 程序 映射 到 多 
处 理性 体系 结构 上 。” 

在 这 一 市 中 ， 我 们 将 仅仅 讨论 一 组 支持 语句 层次 并 发 的 语言 结构 。 此 外 ， 我 们 将 描述 这 些 
结构 在 SIMD 体系 结构 的 机 器 中 的 用 途 (参见 13.1.1 小 节 )， 虽然 这 些 语言 结构 是 被 设计 来 用 于 
各 种 不 同 的 体系 结构 。 

我 们 所 讨论 的 语言 结构 的 问题 是 要 将 处 理 器 之 间 的 通信 ， 以 及 处 理 器 与 其 他 处 理 器 的 存储 
篆 之 间 的 通信 减 到 最 少 。 这 里 的 假设 是 ， 处 理 器 对 于 自己 的 存储 器 的 数据 存 取 ， 比 对 其 他 处 理 
稼 的 存储 器 的 数据 存 取 要 快 。 设 计 优良 的 编译 器 能 够 进行 许多 这 样 的 优化 ， 但 是 如 果 程 序 人 员 
能 够 给 编译 器 提供 可 能 的 有 关 并 发 的 信息 ， 效 果 将 会 好 得 多 。 


13.9.1 高 性 能 Fortran 


高 性 能 Fortran (HPF) (ACM, 1993b) 是 对 于 Fortran 90 所 进行 的 一 系列 扩展 ， 它 的 目的 在 
于 允许 程序 人 员 给 编译 器 提供 信息 ， 从 而 帮助 优化 多 处 理 器 计算 机 上 的 程序 执行 。 HPF 包 括 了 
新 的 说 明 语句 以 及 内 建 的 子 程序 。 在 这 一 节 里 我 们 仅 讨论 这 些 新 的 语句 。 

HPEF 的 主要 说 明 语 名 被 用 来 说 明 处 理 器 的 数目 、 这 些 处 理 器 的 存储 器 中 的 数据 分 布 ， 以 及 
数据 之 间 就 存储 器 位 置 而 言 的 对 准 方式 。 HPF 的 说 明 语 句 以 一 种 特殊 注释 语句 的 形式 出 现 于 
Fortran 程 序 中 。 每 一 条 说 明 语句 都 由 前 绎 !HPF$ 来 引出 ， 这 里 的 ! 是 Fortran 90 用 来 开始 注释 语 
句 的 字符 。 这 种 前 缀 使 得 这 些 说 明 语句 对 于 Fortran 90 编 译 器 为 不 可 见 的 ， 然而 却 容易 被 HPF 
的 编译 器 识别 。 

PROCESSORS 说 明 语句 具有 这 样 的 形式 : 


!HPFS$ PROCESSORS procs (n) 


使 用 这 条 语句 来 给 编译 器 说 明 ， 这 个 程序 产生 的 代码 所 能 够 使 用 的 处 理 器 的 数目 。 这 一 条 


O 虽然 ALGOL 68 中 包括 了 信号 量 类 型 以 便 处 理 语句 层次 的 并 发 ， 但 我 们 将 不 在 这 里 讨论 关于 信号 量 那 种 类 型 


的 应 用 。 
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信息 连同 其 他 的 说 明 -一 起 ， 告 诉 编译 器 如 何 将 数据 分 配 到 与 处 理 器 相关 联 的 存储 器 上 。 
DISTRIBUTE 语 句 说 明 将 要 分 配 什 么 数据 ， 以 及 将 要 使 用 的 分 配 类 型 。 它 所 具有 的 形式 十 


!HPF$ DISTRIBUTE (类 型 ) ONTO procs :: 标识 符 _ 表 列 


在 这 条 语句 中 ,“ 类 型 ”可 以 是 BLOCK 或 CYCLIC。 而 “标识 符 _ 表 列 “， 是 一 些 将 要 被 分 配 
的 数组 变量 名 。 将 一 个 被 说 明 按照 BLOCK 方式 分 配 的 变量 ， 分 成 为 n 个 大 小 相等 的 组 ;其 中 的 
每 一 组 由 连续 的 数组 元 素 所 组 成 ， 将 这 些 元 素平 均 地 分 配给 所 有 处 理 器 的 存储 右 。 例 如 ， 如 采 
一 个 有 500 个 元 素 的 称 为 LIST 的 数组 被 按 BLOCK 方 式 分 配给 五 个 处 理 器 ，LIST 的 前 100 个 元 素 
将 会 被 存储 在 第 一 个 处 理 器 的 存储 器 中 ， 第 二 个 100 个 元 素 存储 在 第 二 个 处 理 器 的 存储 右 中 ， 并 
依 此 类 推 。cYcLIC 分 配 则 将 数组 中 的 单个 元 素 循环 地 存储 到 那些 处 理 器 的 存储 器 中 。 例 如 ， 
如 果 LIST 是 按照 cYCLIC 方 式 被 分 配 到 五 个 处 理 器 中 ， 那 么 LIST 的 第 一 个 元 素 将 被 存储 到 第 一 
个 处 理 器 的 存储 器 中 ， 第 二 个 元 素 则 到 第 二 个 处 理 器 的 存储 器 中 ， 依 此 类 推 。 
ALIGN 语 句 的 形式 是 : 
ALIGN arrayl_element WITH array2_element 
使 用 ALIGN 语 名 来 将 一 个 数组 的 分 配 与 另外 一 个 数组 的 分 配 相 关联 。 例 如 ， 
ALIGN listl(index) WITH list2(index+1) 
说 明 对 于 所 有 的 indqex 值 ，List1 中 下 标 为 indqex 的 元 素 与 List2 中 下 标 为 Index+1L 的 元 
素 ， 将 被 存储 于 同一 个 处 理 器 的 存储 器 中 。 对 于 ALIGN 语 句 中 的 两 个 数组 的 引用 ， 将 会 一 同 出 
现在 程序 中 的 某 一 条 语句 中 。 将 它们 放置 于 相同 的 存储 器 〈 这 也 就 意味 着 相同 的 处 理 器 ) 中 ， 
能 够 确保 对 于 它们 的 引用 将 尽 可 能 地 接近 。 
考虑 下 面 的 示例 代码 段 : 
REAL list 1 (1000), list 2 (1000) 
INTEGER list 3 (500), list 4 (501) 


1HPFS PROCESSORS proc (10) 
!HPF$ DISTRIBUTE (BLOCK) ONTO procs :: list 1, list 2 


!HPF$ ALIGN list 3 (index) WITH list 4 (index+1) 
list 1 (index) 
list_3 (index) 

在 每 次 执行 上 面 的 赋值 语句 时 ， 会 将 两 个 被 引用 的 数组 元 素 存储 在 同一 个 处 理 器 的 存储 器 中 。 

HPF 的 说 明 语 名 实际 上 只 是 为 编译 器 提供 信息 ， 而 编译 器 则 或 许 会 、 也 或 许 不 会 使 用 这 种 
信息 来 优化 它 所 产生 的 代码 。 编 译 些 实际 上 会 怎么 做 ， 取决 于 编译 如 的 复杂 程度 以 及 目标 机 器 
的 体系 结构 。 

FORALL 语 句 ， 说 明 一 组 可 以 被 并 发 执行 的 语句 。 例 如 ， 

FORALL (index = 1:1000) list 1 (index) = list 2 (index) 


说 明 将 数组 list_1 的 元 素 的 值 赋 给 1ist_2 中 的 相对 应 的 元 素 。 在 概念 上 ， 它 说 明 在 所 有 
的 1 000 个 赋值 操作 发 生 之 前 ， 能 够 首先 对 于 赋值 语句 的 右边 求 值 。 这 就 允许 了 并 发 地 执行 所 有 
的 赋值 语句 。HPF 的 FORALL 语 句 也 被 包括 在 Fortran 95 之 中 。 

我 们 仅仅 简略 地 讨论 了 HPF 的 部 分 功能 。 然 而 ， 这 些 讨论 给 读者 提供 了 充分 的 信息 ， 来 理 
解 用 于 具有 大 量 数目 处 理 絮 的 计算 机 的 程序 设计 语言 之 扩展 的 思想 。 


list 2 (index) 
list 4 (index+l) 
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小 结 


能 够 在 指令 ， 语 句 或 子 程序 的 层次 上 并 发 地 执行 。 当 使 用 多 处 理 右 来 实际 地 执行 并 发 单位 时 ， 我 们 
将 这 种 并 发 称 为 物理 并 发 。 如 果 将 并 发 单位 运行 于 单个 的 处 理 器 之 上 ， 我 们 则 称 这 种 并 发 为 逻辑 并 发 。 我 
们 可 以 将 所 有 的 并 发 的 基本 概念 模型 ， 都 称 为 逻辑 并 发 。 

可 以 将 大 多 数 的 多 处 理 器 计算 机 分 为 两 类 : SIMD 或 MIMD 类 。MIMD 计 算 机 可 以 是 分 布 式 的 。 

支持 子 程序 层次 的 并 发 的 语言 必须 提供 两 种 主要 的 功能 : 对 于 共享 数据 结构 的 互 斥 访问 (竞争 同步 )， 
以 及 任务 则 的 合作 (合作 同步 )。 

任务 可 能 存在 不 同 的 状态 : 新 生 、 就 绪 、 运 行 、 阻 塞 以 及 死亡 状态 。 

言 号 量 是 一 种 数据 结构 ， 它 由 一 个 整数 以 及 一 个 任务 描述 队 所 组 成 。 能 够 使 用 信号 量 来 提供 并 发 任 
务 之 则 的 竞争 同步 和 合作 同步 。 信 号 量 很 容易 被 不 正确 地 使 用 ， 这 会 产生 编译 器 、 连 接 器 ， 或 运行 时 系统 
所 不 能 够 发 现 的 错误 。 

管 程 是 一 种 数据 抽象 ， 它 提供 一 种 自然 的 方式 以 允许 任务 间 对 于 共享 数据 的 互 斥 访问 。 好 几 种 程序 
设计 语言 都 支持 管 程 ， 如 Ada，Java 和 C#。 具 有 管 程 的 语言 还 必须 提供 某 种 形式 的 信号 量 以 进行 合作 同步 。 

Ada 中 基于 消息 传递 的 模型 ， 为 并 发 提供 了 复杂 而 有 效率 的 结构 。Ada 中 的 任务 是 重任 务 。 任 务 间 通 
过 会 合 机 制 来 相互 通讯 ， 这 种 机 制 即 为 同步 的 消息 传递 。 会 合 是 一 个 任务 接受 来 自 另 外 一 个 任务 的 消息 的 
一 种 行为 。Ada 包 括 简单 与 复杂 的 方法 来 控制 任务 间 会 合 的 发 生 。 

Ada 95 包 括 了 附加 的 功能 来 支持 并 发 ， 其 中 主要 的 功能 包括 受 保护 的 对 象 和 异步 消息 传递 。Ada 95 以 
两 种 方式 来 支持 管 程 : 任务 和 受 保 护 的 对 象 。 

Java 使 用 一 种 相当 简单 而 有 效 的 方式 来 提供 轻 的 并 发 单位 。 任 何 继承 Thread 或 实现 Runnable 的 类 都 
能 够 覆盖 一 个 被 继承 的 方法 ， 称 为 run 方 法 ， 并 且 能 够 使 得 这 个 方法 的 代码 与 其 他 这 样 的 方法 以 及 main 方 
法 并 发 地 执行 。 将 访问 共享 数据 的 方法 定义 为 同步 的 ， 就 能 够 实现 竞争 同步 。 哪 怕 是 很 小 的 代码 段 也 能 够 
同步 。 通 过 使 用 wait、notify 和 notifyAll 方 法 来 实现 合作 同步 。Thread 类 还 提供 sleep、yield.、 
join 和 :interrupt 方 法 。 

C# 中 对 并 发 的 支持 基于 Java 的 模式 , 然而 却 更 为 复杂 。 任 何方 法 都 可 以 运行 于 线程 之 中 。C# 使 用 
Inter1Lock 类 和 Monitor 类 以 及 lock 语句 来 支持 三 种 线程 同步 。 

高 性 能 Fortran 中 包括 了 一 些 语句 ， 用 以 说 明 如 何 将 数据 分 配 到 与 多 处 理 器 连接 的 存储 器 的 单位 中 ;还 
包括 了 一 些 语句 来 说 明 能 够 被 并 发 执行 的 语句 系列 。 


文献 注释 


Andrews and Schneider (1983)、Holt et al. (1978) 和 Ben-Ari (1982) 详细 讨论 了 并 发 中 的 一 般 课 题 。 

管 程 概念 的 开发 及 管 程 在 并 发 Pascal 中 的 实现 ，Brinch Hansen (1977) 对 其 进行 了 描述 。 

Hoare (1978) 和 Brinch Hansen (1978) 讨论 了 并 发 单位 控制 的 消息 传递 模型 的 早期 开发 。Ichbiah et 
al. (1979) 深入 讨论 了 Ada 中 的 任务 模型 的 发 展 。Ada 95 在 ARM (1995) 中 进行 了 详细 的 描述 。 关 于 高 性 
能 Fortran 则 在 ACM (1993b) 中 被 描述 。 


复习 题 


1. 程序 中 并 发 的 三 种 可 能 的 层次 是 什么 ? 

2. 描述 一 个 SIMD 计算 机 的 逻辑 体系 结构 。 

3. 描述 一 个 MIMD 计算 机 的 逻辑 体系 结构 。 

4. SIMD 计算 机 能 够 最 好 地 支援 什么 层次 的 程序 并 发 ? 
5. MIMD 计算 机 能 够 最 好 地 支援 什么 层次 的 程序 并 发 ? 
6. 物理 并 发 与 逻辑 并 发 之 间 的 差别 是 什么 ? 

7. 一 个 程序 中 的 控制 线 是 什么 ? 
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8. 定义 任务 、 不 相交 任务 、 同 步 、 竞 争 同步 与 合作 同步 、 活 性 、 竞 争 条 件 以 及 死 锁 。 
9. 哪 种 任务 不 需要 任何 类 型 的 同步 ? 

10. 描述 任务 可 能 会 存在 的 五 种 不 同 的 状态 。 

11. 任务 就 绪 队 的 目的 是 什么 ? 

12. 支持 并 发 的 语言 的 有 什么 设计 问题 ? 

13. 描述 信号 量 的 等 待 和 释放 操作 的 行为 。 

14. 什么 是 二 元 信号 量 ? 什 么 是 计数 信号 量 ? 

15. 使 用 信号 量 提供 同步 的 主要 问题 是 什么 ? 

16. 管 程 相 对 于 信和 号 量具 有 什么 优点 ? 


17. 定 义 会 合 、accept 子 句 、entry 子 句 、 施 动 者 任务 、 服 务 者 任务 、 扩 展 的 accept 子 句 、 


accept 子 句 、 关 闭 的 accept 子 句 以 及 完成 的 任务 。 
18. 通过 管 程 的 并 发 与 通过 消息 传递 的 并 发 ， 哪 一 种 更 为 通用 ? 
19. Ada 中 的 任务 是 静态 地 还 是 动态 地 创建 的 ? 
20. 扩展 的 accept 子 句 的 目的 是 什么 ? 
21. Ada 中 的 任务 怎样 来 提供 合作 同步 ? 
22. 相对 于 提供 对 于 共享 数据 对 象 访问 的 任务 而 言 ，Ada 95 中 的 受 保护 的 对 象 的 优点 是 什么 ? 
23. 描述 Ada 95 中 的 异步 select 子 句 。 
24. 哪 种 特别 的 Java 程 序 单位 能 够 与 应 用 程序 中 的 main 方 法 并 发 地 运行 ? 
25. Java 中 的 sleep 方 法 有 什么 用 途 ? 
26. Java 中 的 yield 方 法 有 什么 用 途 ? 
27. Java 中 的 join 方 法 有 什么 用 途 ? 
28. Java 中 的 ijnterrupt 方 法 有 什么 用 途 ? 
29. Java 中 两 个 能 够 被 同步 的 结构 是 什么 ? 
30. 描述 在 Java 中 用 来 支持 合作 同步 的 三 个 方法 的 行为 。 
31. 什么 种 类 的 Java 中 的 对 象 是 管 程 ? 
32. 解释 为 什么 Java 中 包括 了 Runnab1le 接 口 。 
33. 什么 种 类 的 方法 可 以 运行 于 C# 的 线程 之 中 ? 
34. C# 中 的 Sleep 方 法 相对 于 Java 中 的 sleep 方 法 有 什么 差别 ? 
35. C# 中 的 Rbort 方 法 究竟 有 什么 用 途 ? 
36. Interlock 类 的 目的 是 什么 ? 
37.C# 中 的 lock 语 句 有 什么 用 途 ? 
38. 高 性 能 Fortran 中 的 说 明 语句 的 目标 是 什么 ? 
39. 高 性 能 Fortran 中 的 FORALL 语 句 的 目的 是 什么 ? 


练习 题 


1. 清楚 解释 在 支持 协同 程序 、 但 不 支持 并 发 的 程序 设计 环境 中 ， 为 什么 竞争 同步 不 是 一 个 问题 。 


2. 当 发 现 死 锁 时 ， 一 个 系统 所 能 采取 的 最 佳 行动 是 什么 ? 
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3. 忙 于 等 待 ， 是 一 个 任务 等 待 一 件 给 定 的 事件 时 不 断 地 测试 那 件 事件 发 生 的 一 种 方法 。 这 样 一 种 方式 的 


主要 问题 是 什么 ? 


4. 在 13.3 节 的 生产 者 -消费 者 的 示例 中 ， 设 想 我 们 不 正确 地 在 消费 者 过 程 中 使 用 了 wait (access) 代替 了 


release (access )。 当 执行 这 个 系统 时 ， 这 个 错误 将 导致 什么 结果 ? 


5. 根据 一 本 关于 使 用 Intel Pentium 处 理 器 的 计算 机 的 汇编 语言 程序 设计 的 书 ， 确 定 这 本 书 提供 了 什么 指 


令 来 支持 信号 量 的 构造 。 
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6. 假如 两 个 任务 AR 和 B 必 须 使 用 共享 变量 Buf size。 任务 A 将 Buf size 增 加 2， 任务 B 则 从 它 减 去 1。 假 设 
这 种 算术 操作 具有 三 个 步 又: 取得 当前 值 ， 进 行 计算 和 放 回 新 的 值 。 在 缺乏 竞争 同步 的 情况 下 ， 可 能 
的 事件 序列 是 什么 ， 操 作 的 结果 会 是 什么 ”假设 Buf_size 的 初始 值 为 6。 

7. 比较 Java 和 Ada 中 的 竞争 同步 机 制 。 

8. 比较 Java 与 Ada 中 的 合作 同步 机 制 。 

9. 如 霖 一 个 管 程 过 程 调 用 同一 个 管 程 中 的 另 一 个 过 程 ， 会 发 生 什么 情况 ? | 

10. 解释 这 两 种 情况 下 合作 同步 的 相对 安全 性 ; 使 用 信和 号 量 与 使 用 Ada 任 务 中 的 when 子 句 。 

程序 设计 练习 题 

1. 编写 一 个 Ada 任 务 来 实现 通用 的 信号 量 。 

2. 编写 一 个 Ada 任 务 来 管理 一 个 共享 缓冲 区 ， 束 像 在 我 们 例子 中 的 那样 ， 但 必须 使 用 程序 设计 练习 题 1 
中 的 信号 量 任务 。 

3. 在 Ada 中 定义 信号 量 ， 并 且 使 用 这 些 信 号 量 来 为 示例 中 的 共享 缓冲 区 提供 合作 同步 与 竞争 同步 。 


4. 使 用 Java 来 编写 程序 设计 练习 题 3 中 的 问题 。 
5. 使 用 C# 来 编写 这 一 章 中 的 共享 缓冲 区 的 例子 。 
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7. 使 用 Ada 来 编写 程序 设计 练习 题 6 中 的 问题 。 
299) 8. 使 用 C# 来 编写 程序 设计 练习 题 6 中 的 问题 ， 


第 14 草 异常 处 理 和 事件 处 理 


这 一 章 讨论 程序 设计 语言 对 于 许多 当代 程序 中 两 个 相关 部 分 的 支持 ， 这 两 个 部 分 就 是 异常 
处 理 和 事件 处 理 。 蜡 稼 和 事件 发 生 的 时 间 都 是 不 可 以 确定 的 ， 而 且 这 两 者 都 最 好 地 处 理 特 殊 的 
语言 结构 和 过 程 。 其 中 有 些 概念 (例如 传播 ) 对 异常 处 理 和 事件 处 理 几 乎 是 相同 的 。 

首先 我 们 描述 异常 处 理 的 基本 概念 ， 包 括 可 以 被 硬件 和 软件 检测 的 异常 、 异 常 处 理 程序 和 
异常 的 产生 。 然 后 介绍 和 讨论 异常 处 理 的 设计 问题 ， 包 括 异 常 和 异常 处 理 程序 的 绑 定 、 继 续 、 
默认 的 异常 处 理 程序 和 异常 的 禁用 。 接 下 来 将 描述 和 评估 三 种 程序 设计 语言 的 异常 处 理 设施 ， 
包括 Ada、C++ 和 Java。 

本 章 后 面 的 部 分 是 事件 处 理 。 我 们 将 首先 介绍 事件 处 理 的 基本 概念 。 然 后 讨论 对 于 Java 的 
GUI 成 分 中 事件 处 理 的 方法 。 


14.1 异常 处 理 概 述 


大 多 数 的 计算 机 硬件 系统 ， 具 有 检测 某 些 运行 时 错误 情况 的 能 力 ， 例 如 浮 点 数 上 溢 。 在 许 
多 早期 的 程序 设计 语言 所 使 用 的 设计 和 实现 的 方式 ， 使 得 用 户 程序 既 不 能 发 现 也 不 能 处 理 这 样 
的 错误 。 在 这 些 早期 语言 中 ， 发 生 一 种 错误 仅仅 是 引起 程序 终止 ， 并 且 将 控制 转移 到 操作 系统 。 
操作 系统 对 于 运行 时 错误 的 典型 反应 ， 是 显示 一 条 诊断 信息 ， 这 条 信息 可 能 含义 清楚 而 有 用 ， 
或 者 是 十 分 模糊 的 。 在 显示 了 出 错 信 息 后 ， 系 统 就 将 此 程序 终止 。 

然而 ， 在 输入 和 输出 操作 情况 下 ， 有 时 候 情 况 是 不 相同 的 。 例 如 Fortran 中 的 Read 语 句 ， 就 
能 够 截获 输入 错误 以 及 “文件 结尾 ”的 情况 ， 而 这 两 种 问题 都 能 够 被 硬件 输入 设备 发 现 。 在 这 
两 种 情况 下 ，Read 语 名 都 能 够 说 明 用 户 程序 中 用 来 处 理 这 些 情 况 的 一 些 语 名 标号。 当然 我 们 不 
应 该 总 是 将 “文件 结尾 ”的 情况 认为 是 一 种 错误 ， 它 通常 只 不 过 是 一 种 信号 ， 表 明 某 种 类 型 的 
处 理 完 成 了 ， 而 另外 一 种 新 的 类 型 的 处 理 即 将 开始 。 尽 管 “文件 结尾 ”明显 不 同 于 错误 事件 ， 
如 输入 过 程 失败 ，Fortran 使 用 同样 的 机 制 来 处 理 这 两 种 情形 。 考 虑 下 面 Fortran 的 Read 语 句 : 


Read(Unit=5, Fmt=1000, Err=100, End=999) Weight 


这 里 的 Err 子 句 说 明 ， 如 果 在 读 操作 中 发 生 错误 ， 将 控制 转移 到 标号 为 100 的 语句 。End 子 
名 说明， 如果 在 读 操作 中 遇 到 “文件 结尾 ”， 则 将 控制 转移 到 标号 为 999 的 语句 。 因 此 Fortran 使 
用 了 简单 的 分 支 来 处 理 输入 错误 与 文件 结尾 这 两 种 情况 。 

有 一 种 类 型 的 严重 错误 就 不 能 被 硬件 发 现 ， 但 是 可 以 由 编译 器 所 产生 的 代码 发 现 。 例 如 ， 硬 
件 几乎 不 可 能 发 现 数 组 下 标 范 围 的 错误 ，9S 但 是 这 些 错误 却 能 够 导致 在 后 面 程序 执行 中 才 会 注意 
到 的 致命 错误 。 

数组 下 标 范 围 错误 的 检测 有 时 是 语言 的 设计 所 要 求 的 。 例 如 ，Java 编 译 器 就 必须 产生 代码 
来 检测 每 一 个 下 标 表达 式 的 正确 性 。( 但 是 如 果 编 译 器 可 以 在 编译 时 确定 ， 数 组 下 标的 表达 式 不 
会 具有 越界 的 值 时 ，Java 编 译 器 便 不 会 产生 这 样 的 代码 ， 例如， 下 标 是 一 个 字面 常量 的 情形 ,) 
在 C 中 ， 由 于 认为 检测 带 来 的 好 处 与 检测 所 付出 的 代价 相 比 并 不 值得 ， 所 以 不 进行 下 标 范围 的 


日 ”在 20 世 纪 70 年 代 ， 的 确 有 一 些 计算 机 的 硬件 中 能 够 发 现 数组 下 标 范围 的 错误 。 
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检测 。 而 在 茶 些 语言 的 编译 右 中 ， 如 果 程 序 需 要 或 者 是 在 运行 编译 器 的 命令 之 中 ， 可 以 选择 是 
MEIT Peni bl Ata. 

许多 当代 语言 的 设计 人 员 ， 已 经 在 语言 中 包括 了 某 些 机 制 ， 能 够 使 程序 按照 一 种 标准 的 方 
式 ， 对 于 茶 些 运行 时 错误 和 其 他 程序 所 检测 到 的 异常 事件 做 出 反应 。 当 硬件 或 系统 软件 检查 出 
茶 种 事件 的 发 生 时 ， 还 能 够 通知 程序 以 便 能 够 做 出 必要 的 反应 。 所 有 这 些 机 制 都 被 统称 为 异常 
处 理 。 

也 许 使 一 些 语言 不 包括 异常 处 理 的 最 重要 的 原因 ， 是 这 种 处 理 给 语言 所 增加 的 复杂 性 。 


14.1.1 基本 概念 


我 们 将 硬件 能 够 发 现 的 错误 ， 如 读 盘 错误 ， 以 及 硬件 能 够 发 现 的 非 寻 常情 况 ， 如 文件 结尾 ， 
都 认为 是 异常 。 再 进一步 ， 我 们 将 异常 的 概念 扩展 到 包括 任何 可 以 由 软件 发 现 的 错误 或 任何 站 
寻常 的 情况 。 因 此 ， 我 们 将 异常 (exception) 定义 为 :不 论 存在 错误 与 否 ， 任 何 可 能 由 硬件 或 
软件 发 现 的 并 需要 特殊 处 理 的 非 寻 常事 件 。 

异常 检测 所 要 求 的 特殊 处 理 被 称 为 异常 处 理 (exception handling) 。 通 过 一 种 被 称 为 异常 处 
理 程序 (exception handler) 的 代码 单位 ， 来 进行 这 种 处 理 。 当 发 生 与 异常 相关 的 事件 时 ， 蜡 党 
就 被 提出 (raised) 。 在 一 些 最 近 的 基于 C 的 语言 中 ， 将 异常 出 现 称 为 抛 出 的 (thrown) ， 而 不 是 
提出 的 。e 异常 处 理 程序 ， 通 常 根据 异常 类 型 的 不 同 而 不 同 。 当 检测 进行 到 文件 的 结尾 时 ， 几 平 
总 是 需要 这 种 程序 做 出 某 种 特殊 的 行为 。 但 显然 ， 这 种 行为 不 属于 数组 下 标 范围 错误 的 异常 。 
有 的 时 候 ， 异 常 处 理 程序 做 出 的 唯一 行动 ， 可 能 就 是 产生 出 错 信息 以 及 命令 程序 终止 

在 有 些 情形 下 ,程序 人 员 可 能 希望 暂时 忽略 某 种 由 硬件 检测 出 来 的 异常 。 例 如 ， 被 零 除 的 
情况 。 这 可 以 通过 禁用 异常 处 理 来 达到 。 被 禁用 的 异常 处 理 设施 可 以 在 稍 后 再 启用 

即使 在 语言 中 没有 专用 的 异常 处 理 设施 ， 也 可 以 处 理由 用 户 所 定义 的 、 并 且 软 件 可 以 检测 
的 异常 。 如果 在 一 个 程序 单位 里 发 现 了 这 种 异常 通常 是 由 这 个 单位 的 调用 程序 来 处 理 。 一 种 
可 能 的 设计 是 ， 发 送 一 个 额外 的 参数 来 作为 状态 变量 。 被 调用 的 子 程序 根据 计算 的 正确 性 和 下 
常 性 给 状态 变量 赋值 。 当 状态 变量 从 被 调用 的 单位 返回 时 ， 调 用 程序 立刻 测试 这 个 变量 。 如 果 
状态 变量 值 指示 发 生 了 异常 可 能 是 位 于 调用 单位 中 的 异常 处 理 程序 就 行动 起 来 。 许 多 CHES 
的 库 函数 使 用 这 种 方式 的 一 种 变 体 ， 返 回 值 被 用 来 作为 出 错 指 示 器 ， 

另外 一 种 可 能 的 方案 是 传递 一 个 标号 参数 给 子 程序 。 当 然 ， 这 只 能 是 在 旬 许 将 标号 作为 参 
数 使 用 的 语言 中 。 如 果 异 常 发 生 ， 传 递 的 标号 允许 被 调用 单位 返回 到 调用 程序 中 不 同 的 地 点 ， 
与 第 一 种 方案 一 样 ， 异 常 处 理 程序 通常 是 调用 单位 代码 中 的 一 段 。 这 是 Fortran 中 标号 参数 的 
种 常见 用 法 。 

第 三 种 可 能 的 方案 是 将 一 个 异常 处 理 程序 写成 单独 的 子 程序 ， 并 且 可 以 将 这 个 子 程序 作为 
参数 传递 给 被 调用 的 单位 。 在 这 种 情况 下 ， 异 常 处 理子 程序 由 调用 程序 来 提供 。 当 异常 出 现时 
被 调用 单位 直接 调用 异常 处 理子 程序 。 这 种 方法 中 的 问题 是 ， 不 论 需要 与 否 ， 每 一 次 的 子 程序 
调用 ， 都 必须 发 送 异常 处 理子 程序 。 此 外 ， 为 了 要 处 理 一 些 不 同类 型 的 异常 ， 还 必须 传递 几 个 
异常 处 理子 程序 ， 从 而 增加 了 代码 的 复杂 性 。 

如 果 希 望 在 发 现 异常 的 单位 中 处 理 异常 ， 可 以 将 异常 处 理 程序 编写 成 这 个 单位 中 的 代码 正六 

在 语言 中 包括 异常 处 理 有 着 明显 的 优点 。 首 先 ， 如 果 没 有 异常 处 理 的 话 ， 程 序 中 扩容 要 的 


O C++ 是 基于 C 的 语言 中 第 一 种 包括 了 异常 处 理 的 语言 。 之 所 以 使 用 名 词 “ 抛 出 ”， 而 不 是 使 用 “提出 ”， 是 因 
为 在 标准 C 程 序 库 中 包括 了 一 个 名 字 为 raise (提出 ) 的 函数 。 
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检测 错误 情况 的 代码 会 将 整个 程序 搅乱 。 例 如 ， 假 设 一 个 子 程序 中 的 表达 式 包 含 了 10 种 对 于 和 扼 
阵 mat 中 元 素 的 引用 ， 并 且 其 中 任何 一 种 引用 都 可 能 产生 下 标 越界 的 错误 。 此 外 ， 还 假设 这 种 
语言 不 要 求 下 标 范 围 的 检测 。 如 果 没 有 内 建 的 异常 处 理 的 话 ， 每 一 个 上 述 的 引用 操作 的 前 面 ， 
都 必须 有 一 段 代 码 来 检测 可 能 的 下 标 越 界 错误 。 例 如 ， 考 虑 下 面 的 对 于 mat 中 一 个 元 素 的 引用 ， 
矩阵 mat 具 有 10 行 20 列 : 


if (row >= 0 && row < 10 && col >= 0 && col < 20) 
sum += mat[row][col]; 


else = 
System.out.println("Index range error on mat, row =" + 
row +-" col. = " # col); 
语言 中 内 建 的 异常 处 理 使 得 编译 器 能 够 在 每 一 个 矩阵 元 素 的 引用 之 前 插入 这 种 检测 ， 从 而 
极 大 地 缩短 和 简化 了 源 程 序 。 


语言 支持 异常 处 理 的 另外 一 个 优点 是 异常 传播 。 异 常 传播 允许 在 一 个 程序 单位 中 出 现 的 异 
党 ， 由 这 个 程序 单位 的 动态 或 静态 祖先 中 的 某 一 个 其 他 程序 单位 来 处 理 。 这 就 允许 了 多 个 不 同 
的 程序 单位 使 用 一 个 异常 处 理 程序 。 这 种 复 用 能 够 大 大 减少 程序 开发 的 费用 、 程 序 的 规模 和 程 
序 的 复杂 性 。 

一 种 支持 异常 处 理 的 语言 ， 鼓 励 使 用 人 员 考 虑 在 程序 执行 期 间 所 有 可 能 发 生 的 事件 ， 以 及 
如 何 来 处 理 这 些 事件 。 这 种 方法 远 比 不 考虑 各 种 可 能 性 ， 仅 仅 是 希望 问题 不 会 出 现 要 好 得 多 。 
例如 ，Ada 要 求 一 种 多 向 选择 结构 ， 以 便 对 于 控制 表达 式 所 有 可 能 的 值 采 取 不 同 的 行动 。 

好 后， 异常 处 理 可 以 大 大 简化 程序 中 对 于 那些 不 是 错误 ， 但 是 非 寻 常情 形 的 处 理 。 如 果 没 
有 异 剃 处理， 这 种 处 理 将 使 程序 变 得 错综复杂 。 


14.1.2 设计 问题 


现在 我 们 来 讨论 ， 当 异常 处 理 是 程序 设计 语言 的 组 成 部 分 时 ， 异 常 处 理 系 统 的 一 些 设计 间 
题 。 这 种 系统 应 该 允许 内 建 的 ， 以 及 用 户 定义 的 异常 和 异常 处 理 程 序 。 注 意 ， 预 定义 的 异常 是 
隐 式 地 提出 的 ， 而 用 户 定义 的 异常 则 是 显 式 地 由 用 户 代 码 提 出 的 。 考 虑 下 面 的 子 程序 框架 ， 其 
中 包括 了 隐 式 出 现 的 异常 的 异常 处 理 机 制 

void example() { 

average = sum / total; 
Ri 
/* 异常 处 理 器 */ 
when zero divide { 
average = 0; 


printf("Error—divisor (total) is zero\n"); 


} 
} 


这 个 函数 能 够 在 截获 被 零 除 的 异常 后 ， 将 控制 转移 到 适当 的 处 理 程序 ， 然 后 执行 处 理 程序 。 
异 贡 处 理 的 第 一 个 重要 的 设计 问题 ， 是 怎样 将 发 生 的 异常 与 异常 处 理 程序 相 绑 定 。 这 个 问 
题 发 生 在 两 个 不 同 的 层次 上 。 在 程序 单位 层次 上 的 问题 是 ， 怎 样 将 出 现在 一 个 程序 单位 中 不 同 
地 所 相同 的 异常 ， 与 不 同 的 异常 处 理 程序 相 绑 定 。 例 如 在 上 面子 程序 的 示例 中 ， 就 编写 了 一 个 
异 贡 处 理 程序 〈 程 序 中 所 显示 的 那 段 代 码 ) ， 来 处 理 在 一 条 特定 语句 中 所 出 现 的 被 零 除 的 异常 。 
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历史 注释 


PL/I (ANSI, 1976) 开创 了 
允许 用 户 程 序 直 接 参 与 异常 处 理 
的 概念 。 这 种 语言 允许 用 户 针 对 
语言 定义 的 一 长 列 的 异常 ， 来 纺 
写 异 常 处 理 程序 。 此 外 ，PL/I 还 
引入 了 用 户 定 义 的 异常 的 概念 ， 
允许 程序 创建 可 由 软件 检测 的 异 
常 。 这 些 异 常 使 用 了 与 内 建 异常 
相同 的 机 制 。 

自从 PL/I 被 设计 以 后 ， 人 们 


plage 


但 假设 函数 中 具有 几 个 带 有 除法 操作 符 的 其 他 表达 式 。 对 
于 这 些 操作 符 ， 这 个 异 弟 处 理 程序 或 许 就 不 适用 了 。 因 此 ， 
应 该 可 以 将 在 某 些 特定 的 语句 中 提出 的 那些 异常 ， 绑 定 到 
茶 些 特定 的 异常 处 理 程序 之 上 ， 即 使 相同 的 异常 可 能 会 被 
许多 不 同 的 语句 提出 。 

在 较 高 的 层次 上 ， 绑 定 问题 可 能 出 现 于 提出 异常 的 程 
序 单位 中 不 存在 局 部 异常 处 理 程序 。 在 这 种 情况 下 设计 人 
员 必 须 决 定 ， 是 否 将 异常 传播 到 某 个 其 他 的 单位 上 去 。 如 
末 要 传播 ， 又 应 该 传播 到 哪 一 个 单位 ?怎样 来 进行 异常 的 
传播 以 及 应 该 传播 多 远 ， 所 有 这 些 对 于 异常 处 理 程 序 的 可 
写 性 具有 极 大 的 影响 。 例 如 ， 如 果 处 理 器 必须 是 局 部 的 ， 


那么 就 得 编写 许多 的 处 理 程 序 ， 这 会 使 得 程序 的 写 与 读 都 
变 得 很 复杂 。 另 一 方面 ， 如 果 进 行 异 常 的 传播 ， 一 个 处 理 
程序 可 能 要 处 理 多 个 程序 单位 中 所 提出 的 相同 的 异常 ， 这 
样 就 可 能 要 求 处 理 器 比 期 望 中 的 更 为 通用 。 

在 异常 处 理 程序 执行 之 后 ， 可 以 将 控制 转移 到 程序 中 、 
处 理 程序 代码 之 外 的 某 个 位 置 ， 或 者 仅仅 是 终止 程序 的 执 
行 。 我 们 称 这 个 问题 为 处 理 器 执行 后 的 继续 控制 问题 ， 或 
向 称 为 继续 (continuation)。 终 止 程序 的 执行 显然 是 最 为 简 
单 的 选择 ， 并 且 在 存在 着 许多 错误 异常 的 情况 下 ， 这 是 最 
佳 的 选择 。 然 而 在 其 他 的 情况 ， 特 别 是 在 那些 非 寻 常 但 非 
错误 事件 的 情况 下 ， 继 续 执行 则 是 最 佳 的 选择 。 这 种 设计 称 为 重新 开始 (resumption)。 此 时 ， 
需要 选择 某 些 规则 来 决定 从 哪里 开始 继续 执行 。 被 继续 执行 的 可 能 是 出 现 异常 的 语句 ， 也 可 能 
是 在 出 现 异常 的 语句 之 后 的 语句 ， 或 者 可 能 是 某 一 个 其 他 的 程序 单位 。 回 到 出 现 异 常 的 语句 可 
能 征 一 个 好 的 选择 ， 但 是 在 错误 异常 的 情况 下 ， 如 果 处 理 程序 能 够 修正 导致 异常 被 提出 的 数值 
或 操作 ， 这 种 方法 才 是 有 用 的 。 否 则 只 能 是 再 次 地 提出 异常 。 对 于 错误 异常 所 必需 的 修正 ， 通 
前 非常 困难 。 即 使 可 能 修正 的 话 ， 也 可 能 不 是 一 种 可 靠 的 方法 。 它 仅仅 允许 程序 除去 问题 的 症 
状 ， 而 不 消除 根源 。 

图 14-1 说 明 异 第 与 异常 处 理 程 序 的 绑 定 以 及 继续 。 

当 包 含 异 常 处 理 时 ， 子 程序 能 通过 两 种 方法 终止 其 执行 :执行 完成 或 遇 到 异常 。 在 一 些 情 
形 下 ， 不 管子 程序 是 怎样 终止 执行 的 ， 完 成 一 些 计算 是 必须 的 。 指 定 这 种 计算 的 功能 称 为 析 构 
(finalization) 。 是 否 支持 结束 化 明显 是 异常 处 理 的 设计 问题 。 

另 一 个 设计 问题 是 : 如 果 人 允许 用 户 来 定义 异常 ， 怎 样 来 说 明 异 常 ? 通常 的 答案 是 将 异 党 的 
声明 ， 放 置 在 这 些 异 常 可 能 出 现 的 程序 单位 的 声明 部 分 。 被 声明 异常 的 作用 域 ， 通 常 是 包含 这 
个 声明 的 程序 单位 的 作用 域 。 

在 语言 提供 预定 义 的 异常 的 情形 下 ， 随 之 而 来 的 还 有 好 几 个 其 他 的 设计 问题 。 例 如 ， 语 言 
的 运行 时 系统 是 否 应 该 为 这 些 内 建 异常 ， 提 供 默认 处 理 器 ? 或 者 ， 用 户 是 否 应 该 为 所 有 的 异 党 
都 编写 异常 处 理 程 序 ? 另 外 的 一 个 问题 是 ， 内 建 异 常 是 否 能 够 被 用 户 程序 显 式 地 提出 。 如 果 用 
户 能 在 可 以 通过 软件 检测 的 情况 下 ， 使 用 预定 义 的 异常 处 理 的 程序 ， 那 将 是 很 方便 的 。 

妃 一 个 问题 是 : 是 否 应 该 将 可 以 被 硬件 检测 出 来 的 错误 视 为 可 以 被 用 户 程序 处 理 的 异常 。 
如 林 不 应 该 的 话 ， 那 么 显然 所 有 异常 都 是 可 以 通过 软件 来 检测 的 。 这 里 一 个 相关 的 问题 是 ， 是 


进行 了 大 量 的 工作 来 设计 异常 处 
理 的 替代 方法 。 特 别 是 ，CLU 
(Liskov et al.，1984) Mesa 
(Mitchell et al., 1979). Ada. 
COMMON LISP (Steele, 1984). 
ML (Milner et al., 1990), C++, 
Modula-3 (Cardelli et al., 1989), 
Eiffel, JavafeC#, a ade yo BF 
处 理 的 设施 ，。 
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否 应 该 有 任何 预定 义 的 异常 。 预 定义 的 异常 ， 由 硬件 或 系统 软件 隐 式 地 提出 。 
执行 程序 异常 处 理 程序 


when .... 
a begin 
—? 异常 与 处 理 程序 绑 定 ? 
2 Ooo | end; 
被 提出 的 异常 )—> sone statement; when ... 
Pe begin 
end; a 
ae end; 
when ... 


继续 begin 








~ 





终止 





图 14-1 异常 处 理 的 控制 流程 
”了 基 后 的 一 个 问题 是 : 是 否 可 以 暂时 或 永远 地 禁用 预定 义 的 或 用 户 定 义 的 异常 。 在 某 种 程度 
上 ， 这 是 一 个 哲学 问题 ， 尤 其 是 在 预定 义 错误 的 情况 下 。 例 如 ， 假 设 一 种 语言 具有 一 种 预定 义 
的 异常 ， 当 下 标 范 围 错误 出 现时 则 这 个 异常 被 提出 。 许 多 人 相信 ， 下 标 范围 错误 总 是 应 该 被 检 
测 的 ， 因 而 对 下 标 范围 错误 的 检测 不 应 该 被 禁用 。 但 另外 一 些 人 则 争辩 道 ， 检 测 下 标 范围 错误 
的 代价 太 高 ， 如 果 相 信 代 码 没 有 什么 错误 的 话 ， 就 没有 必要 检测 下 标 范围 的 错误 ， 
可 以 将 异常 处 理 的 设计 间 题 总 结 如 下 : 
© 怎样 以 及 在 何 处 来 说 明 异 常 处 理 程序 ? 它们 的 作用 域 是 什么 ? 
* 怎样 将 异常 出 现 和 异常 处 理 程序 相 绑 定 ? 
o 提供 了 某 种 析 构 形式 吗 ? 
* 在 完成 执行 异常 处 理 程序 后 ， 如 果 要 继续 执行 程序 ， 应 该 从 哪里 开始 继续 执行 ? (这 是 继 
续 的 问题 。) 
* 异 第 信息 能 传递 给 处 理 程序 吗 ? 
© 怎样 来 说 明 用 户 定义 的 异常 ? 
* 如 未 有 预定 义 的 异常 ， 而 一 些 程序 又 没有 自己 的 异常 处 理 程序 ， 应 该 给 这 些 程序 提供 默 
认 的 异常 处 理 程 序 吗 ? 
* 预 定义 的 异常 可 以 被 显 式 地 提出 吗 ? 
© 应 该 像 能 够 被 处 理 的 异常 一 样 来 对 待 可 以 被 硬件 发 现 的 错误 吗 ? 
* 存在 任何 预定 义 的 异常 吗 ? 


© 预定 义 的 异常 可 能 被 禁用 吗 ? 
现在 我 们 已 经 准备 就 绪 ， 来 讨论 三 种 当代 程序 设计 语言 的 异常 处 理 设施 ， 


14.2 Ada 中 的 异常 处 理 
Ada 中 的 异常 处 理 是 构造 更 为 可 靠 软件 系统 的 一 种 有 力 工具 。 它 包括 了 两 种 较 早期 的 语言 
PL/I 和 CLU 中 ， 设 计较 好 的 异常 处 理 部 分 。 


14.2.1 异常 处 理 程序 
通 芝 ，Ada 中 的 异常 处 理 程序 对 于 提出 异常 的 代码 来 说 是 局 部 的 〈 尽 管 它们 能 传播 到 其 他 


(oN 
© 
Oo 
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程序 单元 ) 。 因 为 异常 处 理 程序 与 代码 具有 同样 的 引用 环境 ， 所 以 异常 处 理 程序 不 需要 也 不 允许 
参数 。 因 此 ， 如 果 在 一 个 与 引起 异常 的 单元 不 同 的 单元 中 处 理 异 常 ， 那 么 没有 关于 异常 的 信息 
能 传递 到 处 理 函 数 。9 
异常 处 理 程序 有 下 面 一 般 的 形式 ， 这 里 给 出 EBNF 形 式 .: 
when 异常 选择 {| 异常 选择 } => 语句 序列 
这 里 的 花 括号 是 元 符号 ， 表示 所 包含 的 内 容 可 能 不 会 出 现 ， 也 可 能 任意 次 地 重复 出 现 。 异 
常 选择 所 具有 的 形式 为 : 
异常 名 | others 
异常 名 代表 异常 处 理 程序 所 要 处 理 的 某 个 或 某 些 特定 的 异常 。 语 句 序 列 是 异常 处 理 程序 的 
程序 体 。 保 留 字 others 说 明 这 个 异常 处 理 程序 ， 将 处 理 任何 没有 在 其 他 局 部 异常 处 理 程序 中 
te BPR FE o 
能 够 将 异常 处 理 程序 包含 在 块 、 子 程序 、 程 序 包 或 任务 体 中 。 不 论 它 们 是 出 现 于 块 中 ， 还 
是 出 现在 程序 单位 中 ， 都 将 异常 处 理 程 序 集中 在 exception 子 句 里 ， 并 且 必 须 将 这 种 子 句 放置 
FARAH. file, exception fw RHA: 
begin 
-- 块 、 或 单位 体 一 
exception 
when 异常 名 _1 => 
-- 第 一 个 异常 处 理 程序 -~- 
When 异常 名 2 => 
一 第 二 个 异常 处 理 程 序 ~- 
一 其 他 的 异常 处 理 程序 一 


end; 


任何 能 够 合法 出 现 于 块 中 或 单位 中 的 语句 ， 也 能 够 合法 地 出 现在 异常 处 理 程序 中 。 
14.2.2 异常 与 异常 处 理 程序 的 绑 定 


当 提出 异 第 的 程序 块 或 程序 单位 包含 了 一 个 异常 处 理 程 序 时 ， 异 常 与 处 理 程 序 的 绑 定 为 静 
态 的 。 如 采 当 提出 异 第 的 程序 块 或 程序 单位 ， 没 有 包含 处 理 这 种 异常 的 处 理 程 序 时 ， 这 个 异常 
就 被 传播 到 某 个 其 他 的 块 或 单位 中 去 。 异 常 的 传播 方式 取决 于 出 现 异常 的 程序 实体 。 

当 异 常 在 一 个 过 程 中 被 提出 时 ， 不 论 是 在 声明 语句 确立 时 ， 还 是 在 程序 体 执行 时 ， 如 果 这 
个 过 程 没有 处 理 这 种 异常 的 处 理 程 序 ， 异 常 就 被 隐 式 地 在 调用 的 位 置 传播 到 调用 程序 单位 去 。 
这 种 策略 反映 了 一 种 设计 思想 ， 即 异常 传播 应 该 是 经 由 控制 途径 ( 即 动态 祖先 ) 的 回调 ， 而 不 
是 经 由 静态 祖先 。 

如 采 异 第 所 传播 到 的 调用 单位 也 没有 这 种 异常 的 处 理 程序 ， 就 再 一 次 将 这 个 异常 传播 到 这 
个 单位 的 调用 单位 。 如 果 必 要 的 话 ， 这 种 过 程 将 一 直 继 续 到 主 程序 。 如 果 异 常 被 传播 到 主 程序 ， 
而 在 主 程序 也 找 不 到 相应 的 处 理 程序 ， 程 序 就 被 终止 。 | 

在 异 弟 处 理 中 ， 可 以 认为 Ada 的 程序 块 是 无 参数 的 过 程 。 当 执行 控制 达到 程序 块 的 第 一 条 
语句 时 ， 这 个 块 由 父辈 过 程 所 “调用 。 当 一 个 异常 在 一 个 程序 块 中 被 提出 ， 不 论 是 在 块 的 声明 
语句 、 或 者 是 在 块 的 可 执行 语句 中 ， 而 且 这 个 程序 块 中 不 具有 这 种 异常 的 处 理 器 时 ， 便 将 异常 
传播 到 下 一 个 比较 大 的 包含 作用 域 中 ， 即 “调用 ”这 个 程序 块 的 代码 之 中 。 异 常 传播 的 地 点 ， 


日 ” 它 并 不 是 完全 正确 。 处 理 程序 获取 异常 名 ， 该 异常 的 简短 描述 和 引发 异常 的 大 致 位 置 是 可 能 的 。 
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是 在 提出 它 的 程序 块 的 结尾 处 ， 也 即 它 将 “返回 ”的 地 点 。 

当 腊 第 在 一 个 程序 包 的 体 中 被 提出 ， 并 且 这 个 包 体 中 不 具有 处 理 这 种 异常 的 处 理 程序 时 ， 
便 将 这 个 异常 传播 到 含有 这 个 包 的 声明 单位 中 的 声明 部 分 。 如 果 这 个 包 碰 巧 是 一 个 分 别 编译 的 
库 程 序 单位 ， 程 序 就 将 终止 。 

如 采 异 常 是 在 任务 体 的 最 外 一 层 被 提出 ， 而 且 这 个 任务 包含 了 一 个 处 理 这 种 异常 的 处 理 程 
序 ， 这 个 处 理 程序 就 被 执行 ， 并 且 任 务 被 标记 为 完成 。 如 果 这 个 任务 没有 包含 一 个 处 理 这 种 异 
稍 的 处 理 程序 ， 这 个 任务 就 简单 地 被 标记 为 完成 ， 但 异常 并 不 被 传播 。 任 务 的 控制 机 制 过 于 复 
杂 ， 因 而 无 法 合理 并 简单 地 回答 一 个 未 处 理 的 异常 是 否 应 该 被 传播 。 

异 节 也 可 能 发 生 在 子 程序 、 块 、 包 和 任务 的 声明 段 的 确立 期 间 。 例 如 ， 假 设 调用 一 个 函数 
来 对 其 声明 语句 中 的 一 个 变量 设 定 初 值 ， 如 ; 

procedure River is 

Current Flow : Float := Get Flow; 


begin 
end River; 


假设 Get_Flow 是 一 个 无 参数 的 函数 。 如 果 Get_Flow 提 出 一 个 异常 ， 并 将 这 个 异常 传播 
给 它 的 调用 程序 ， 这 个 异常 就 在 这 个 声明 语句 中 被 提出 。 声 明确 立 期 间 的 存储 空间 分 配 ， 也 可 
能 提出 异常 。 当 异常 的 提出 发 生 在 子 程序 、 块 、 包 和 任务 的 声明 确立 期 间 ， 也 完全 可 以 像 在 代 
码 中 提出 的 异常 一 样 这 将 些 异 常 传播 。 在 任务 的 情形 ， 任 务 被 标记 为 完成 但 并 没有 更 进一步 的 
腊 第 处 理 ， 内 建 异常 Tasking_Error 将 在 任务 启动 之 处 被 提出 。 


14.2.3 继续 


在 Ada 中 ， 提 出 一 个 异常 的 程序 块 或 程序 单位 ， 连 同 所 有 传播 这 个 异常 但 又 不 能 处 理 它 的 
程序 单位 一 起 ， 总 是 被 终止 。 在 处 理 异常 之 后 ， 控 制 从 来 不 会 隐 式 地 返回 到 提出 异常 的 块 或 程 
序 单位 。 控 制 只 是 在 exception 子 句 之 后 继续 ， 而 exception 子 句 又 总 是 位 于 块 或 程序 单位 
的 尾部 。 这 使 得 控制 立即 就 返回 到 较 高 的 层次 上 去 。 


币 的 程序 单位 不 能 够 被 继续 或 重新 启动 。 然 而 在 块 的 情况 下 ， 在 一 条 语句 提出 异常 并 在 异 党 被 
处 理 之 后 ， 这 条 语句 可 以 被 重新 试用 。 例 如 ， 假 设 提 出 异常 的 语句 ， 以 及 处 理 这 种 异 党 的 处 理 
程序 都 在 同一 个 程序 块 中 ， 而 且 这 个 程序 块 本 身 被 包含 在 一 个 循环 里 。 下 面 的 代码 段 示例 ， 说 
明了 这 样 的 一 个 结构 ， 这 个 代码 段 从 键入 获得 所 期 望 范围 中 的 四 个 整数 值 


type Age Type is range 0..125; 

type Age List Type is array (1..4) of Age Type; 
package Age IO is new Integer IO (Age Type); 
use Age IO; 
Age List : Age List Type; 
begin 

for Age Count in 1..4 loop 

loop -- 当 异 常 出 现时 用 于 重复 的 循环 
Except Blk: 


Cn 
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begin -- 封装 异常 处 理 的 复合 语句 
Put Line("Enter an integer in the range Oal25" Ys 
Get(Age List(Age Count) ); 
exit; 
exception 
when Data Error => -- 输入 的 字符 串 不 是 数字 
Put Line("Illegal numeric value"); 
Put Line("Please try again"); 
when Constraint Error => -- 输入 值 < 0 或 者 > 125 
Put Line("Input number is out of range"); 
Put Line("Please try again"); 
end Except Blk; 


end loop; -- 当 有 异常 时 ， 结 束 无 限 循环 ， 以 便 重复 输入 
end loop; -- 结束 1. .4 循环 中 的 Age Count 


在 接收 到 一 个 有 效 的 输入 数字 前 ， 控 制 被 停留 在 包含 这 个 块 的 内 循环 中 。 
14.2.4 其 他 设计 选择 
在 默认 包 Standard 中 定义 了 四 种 异常 : 


Constraint Error 
Program Error 
Storage Error 
Tasking Error 


其 中 的 每 一 种 实际 上 是 异常 的 一 个 种 类 。 例 如 ， 当 数组 下 标 越界 时 ， 当 一 个 具有 范围 限制 
的 数值 变量 出 现 范 围 错误 时 ， 当 引用 一 个 记录 域 而 这 个 域 不 在 一 个 判别 联合 中 时 ， 以 及 在 许多 
其 他 的 情况 下 ， 异 常 Constraint Error 会 被 抛 出 。 

除了 在 Standard 中 定义 的 异常 之 外 ， 其 他 预定 义 的 包 还 定义 了 其 他 的 异常 。 例 如 ， 
Ada.Text IO 定 义 了 JEnd Error 异 常 。 

用 户 定义 的 异常 使 用 下 面 的 声明 形式 来 定义 : 

异常 名 表 列 : exception 

这 样 定义 的 异 肖 与 预定 义 异 常 被 完全 一 样 来 对 待 ， 除 了 这 种 异常 必须 被 显 式 地 提出 之 外 。 

有 默认 的 处 理 程序 用 于 预定 义 的 异常 ， 这 些 程序 都 导致 程序 终止 。 

异 弟 由 raise 语 句 来 显 性 地 提出 ，raise 语 句 的 一 般 形式 为 

raise [异常 名 ] 


能 够 出 现 一 条 不 命名 异常 raise 语句 的 唯一 位 置 ， 是 在 一 个 异常 处 理 程 序 之 中 。 此 时 ， 它 
提出 引起 处 理 絮 执行 的 同一 个 异常 。 它 将 具有 依 前 面 描述 的 异常 传播 规则 ， 来 传播 异常 的 实际 
效 末 。 在 一 个 异常 处 理 程序 中 的 raise 语 句 很 有 用 处 ， 尤 其 当 人 们 希望 在 异常 被 提出 的 位 置 打 
印 一 条 出 错 信息 ， 然 而 却 是 在 另外 的 一 个 位 置 来 处 理 这 个 异常 时 。 

Ada 中 的 pragma 是 一 条 对 于 编译 器 的 指令 。 通 过 使 用 Suppress pragma 指令 可 以 禁用 基 
些 Ada 程 序 中 内 建 异 常 组 成 部 分 的 特定 的 运行 时 检测 。 这 条 指令 的 简单 形式 为 : 


pragma Suppress (检测 名 ) 


这 里 的 “检测 _ 名 ”是 一 种 特定 异常 检测 的 名 字 。 在 本 章 的 后 面 ， 还 将 给 出 一 些 异常 检测 的 
示例 。 
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Suppress pragma 指 令 只 能 够 出 现在 声明 段 。 当 它 出 现时 ， 就 可 能 在 相关 的 块 或 程序 单 
位 中 暂停 所 说 明 的 检测 。 显 式 提出 的 异常 不 受 suppress 的 影响 。 虽 然 并 不 存在 着 硬性 的 要 求 ， 
但 大 多 数 Ada 的 编译 器 都 实现 了 Suppress pragma 指 令 。 

能 够 被 蔡 用 的 检测 有 示例 如 下 : Index_Check 和 Range_Check， 它 们 说 明 的 是 Ada 程 序 
中 的 两 种 常用 检测 ，Index_check 指 的 是 数组 下 标 范围 的 检测 ， Range_Check 指 的 是 检测 赋 
给 于 类 型 变量 的 值 的 范围 。 如 果 Index_Check 或 Range_Check 被 违反 的 话 ， 就 会 提出 
Constraint Error 异 常 。 Division_Check 和 Overflow_Check 是 与 Numeric Error 
腊 第 有 关 的 可 禁用 的 检测 。 下 面 的 pragma 指 令 禁 用 数组 下 标 范 围 的 检测 . 


pragma Suppress(Index Check); 
了 


还 可 以 使 用 Suppress 将 所 说 明 的 检测 ， 进一步 地 限制 到 特定 的 对 象 、 类 型 、 子 类 型 和 程 
序 单 位 上 。 


14.2.5 一 个 示例 


下 面 的 示例 程序 ， 介 绍 Ada 异 常 处 理 程序 中 ， 一 些 简单 而 通常 的 用 法 。 这 个 程序 使 用 一 个 
计数 绒 数 组 来 计算 并 打印 输入 分 数 的 分 布 。 输 入 是 一 列 分 数 ， 用 负数 来 终止 输入 。 因 为 分 数 是 
AAS (Natural 类 型 )， 所 以 会 产生 constraint Error 异 常 。 一 共有 10 个 类 别 的 分 数 等 
级 (0~9, 10~19, =, 90~100), 使 用 输入 分 数 来 计算 它们 在 计数 器 数组 中 的 下 标 ， = 
计数 器 数组 中 的 元 素 对 应 于 一 个 分 数 等 级 类 别 。 无 效 的 输入 分 数 ， 被 认为 是 计数 器 数组 的 下 标 
出 错 。 又 因为 所 有 的 分 数 等 级 类 别 都 具有 10 个 可 能 的 分 数值 ， 然而 最 高 的 等 级 类 别 却 有 11 个 分 
数值 : (90，91，…，100)， 所 以 100 分 在 分 数 分 布 的 计算 中 ， 是 一 个 特殊 的 分 数 (A 的 分 数 
比 B 的 分 数 、 或 C 的 分 数 多 的 事实 ,说明 老师 的 慷慨 )。 同样 也 是 使 用 处 理 无 效 输 入 分 数 的 异常 
处 理 程序 ， 来 处 理 100 分 的 情形 。 


-- 分 数 的 分 布 
-- 输 入 :一 列表 示 分 数 的 整数 值 , 后跟 
i 一 个 负数 
-- 输 出 :分 数 分 布 情况 ,分 数 等 级 
-- (0~9,10~19,...,90~100) 
with Ada.Text_I0O, Ada.Integer.Text IO; 
use Ada.Text_IO, Ada.Integer.Text IO; 
procedure Grade Distribution is 
Freq: array (1..10) of Integer := (others => 0); 
New Grade : Natural; 
Index, 
Limit 1, 
Limit 2 : Integer; 
begin 
Grade_Loop: 
loop 
begin -- 下 标 范 围 处 理 块 
Get (New _ Grade); 
exception 


when Constraint_Error => -- for negative input 
exit Grade Loop; 
end; -- end of negative input block 


Index := New Grade / 10 + 1; 
begin -- A block for the subscript range handler 
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i 
Freq(Index) := Freq(Index) + 1; 
exception 
when Constraint Error => -- for index range errors 


if New Grade = 100 then 
Freq(10) := Freq(10) + 1; 
else 
Put("ERROR -- new grade: "); 
Put (New_Grade) ; 
Put(" is out of range"); 
New Line; 
end if; 
end; -- 结束 
end loop; 
-- Produce output 
Put("Limits Frequency"); 
New Line; New Line; 
for Index in 0..9 loop 


Limit 1 := 10 * Index; 

Limit 2 := Limit_1 + 9; 

if Index = 9 then 
Limit 2 := 100; 

end if; 


Put (Limit 1); 
Put (Limit 2); 
Put (Freq(Index + 1)); 
New Line; 
end loop; -一 结束 循环 Index in 0..9 ... 
end Grade Distribution; 
注意 ， 处 理 无 效 输入 分 数 的 代码 是 在 自己 的 局 部 程序 块 中 。 这 人 允许 了 异常 处 理 之 后 程序 的 
继续 ， 如 同 前 面 所 描述 的 键入 数值 的 例子 一 样 。 负 数 输入 的 处 理 函 数 也 在 它 自己 的 块 中 。 这 样 
的 原因 是 限制 处 理 负数 输入 引起 Constraint_Error 异 常 的 处 理 函 数 的 作用 域 。 


14.2.6 评估 
如 同 其 他 的 一 些 语言 的 结构 一 样 ， 至 少 是 在 设计 时 期 (20 世纪 70 年 代 后 期 至 20 世 纪 80 年 代 


”初期 )，Ada 中 异常 处 理 的 设计 代表 了 参与 人 员 的 一 致意 见 。 相 对 于 PL/I 中 的 异常 处 理 ，Ada 的 


设计 显然 有 了 重大 的 进步 (参见 14.1.2 小 市 中 的 历史 注释 部 分 )。 在 相当 长 的 时 期 内 ，Ada 曾 经 
是 唯一 广泛 使 用 的 包含 了 异常 处 理 的 语言 。 现 在 ， 异 常 处 理 已 经 成 为 大 多 数 新 近 定义 的 语言 中 
的 一 部 分 。 曾 经 有 段 时 间 ，Ada 古 包含 异 第 处 理 的 广泛 使 用 的 语言 。 

Ada 的 异常 处 理 有 一 些 问题 。 其 中 一 个 问题 是 允许 异常 传播 到 异常 不 可 见 的 外 部 作用 域 的 
传播 模型 。 发 现 传 播 异 第 的 引发 位 置 并 不 总 是 可 能 的 。 
wa 例如 ， 引 发 异常 的 任务 不 能 处 理 它 ， 只 是 简单 地 关 
It ° 

最 后 ， 当 Ada 95 加 入 对 面向 对 象 程序 设计 的 支持 时 ， 它 的 异常 处 理 没 有 扩展 来 处 理 新 结构 。 
例如 ， 当 在 块 中 创建 和 使 用 类 的 几 个 对 象 ， 它 们 中 的 一 个 传播 一 个 异常 时 ， 找 到 哪 一 个 对 象 引 
A T Se Fi ae Ay ER ) 

Romanovsky [Sander (2001) 讨 论 了 Ada 的 异常 处 理 问 题 。 


14.3 C++ 中 的 异常 处 理 
ANSI C++ 标准 化 委员 会 于 1990 年 接受 了 C++ 的 异常 处 理 ， 此 后 ，C++ 的 异常 处 理 被 C++ 的 许 
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多 种 实现 所 采纳 。 它 的 设计 部 分 地 基于 CLU、Ada 和 ML 语言 中 的 异常 处 理 的 设计 。C++ 中 的 异 
常 处 理 与 Ada 中 的 异常 处 理 之 间 的 主要 区 别 是 C++ 中 没有 预定 义 的 异常 (除了 它 的 标准 程序 库 中 
的 之 外 )。 因 而 ，C++ 中 的 异常 只 能 是 用 户 定义 或 库 定 义 的 ， 并 且 这 些 异 常 都 是 经 显 式 提出 的 。 


14.3.1 异常 处 理 程 序 


在 14.2 市 里 我 们 曾经 了 解 到 ，Ada 使 用 程序 单位 或 块 来 说 明 异 常 处 理 程序 的 作用 域 。C++ 则 
使 用 一 种 特别 的 结构 ， 这 种 结构 由 保留 字 try 引 出 。 一 个 try 结 构 包 括 一 个 称 为 try 子 句 的 复合 
语句 以 及 一 列 异常 处 理 程序 。 这 些 复合 语句 定义 了 所 跟随 的 异常 处 理 程 序 的 作用 域 。 这 种 构造 
的 一 般 的 形式 是 

try 1 

//** 提出 一 个 异常 的 代码 


} 

catch ( 形 参 ) { 

//** 一 个 异常 处 理 程序 的 体 
} 


catch ( 形 参 ) { 
//** 一 个 异常 处 理 程序 的 体 
} 


其 中 的 每 一 个 catch 函 数 都 是 一 个 异常 处 理 程序 。 一 个 catch 函 数 可 能 只 具有 一 个 形 参 ， 
这 个 形 参 与 C++ 的 函数 定义 中 的 相 类 似 ， 但 它 也 可 能 仅仅 是 一 种 省 略 形 参 。 具 有 一 个 省 略 形 参 
的 处 理 程 序 ， 是 一 种 捕捉 所 有 异常 的 处 理 程序 ， 如 果 对 于 提出 的 异常 没有 找到 合适 处 理 程序 ， 
这 种 处 理 程 序 就 被 启动 。 就 像 在 函数 原型 中 的 一 样 ， 这 个 形 参 也 可 以 仅仅 是 一 个 类 型 说 明 符 ， 
如 £1loat。 在 这 种 情况 下 ， 形 参 的 唯一 目的 ， 就 是 使 得 这 个 异常 处 理 程序 能 够 唯一 地 被 标识 。 
当 关 于 异常 的 信息 被 传递 给 处 理 程序 时 ， 这 个 形 参 包括 了 一 个 用 于 标识 目的 的 变量 名 。 因 为 这 
种 参数 的 类 可 以 是 任何 用 户 所 定义 的 类 ， 从 而 参数 可 以 包括 任何 所 需 数目 数据 成 员 。 关 于 异常 
与 异常 处 理 程序 的 绑 定 ， 将 在 14.3.2 小 节 中 进行 讨论 。 

在 C++ 的 异常 处 理 程序 中 ， 能 够 包括 C++ 的 任何 代码 。 


14.3.2 异常 与 异常 处 理 程 序 的 绑 定 
C++ 中 的 异常 只 能 够 通过 throw 语 句 被 显 式 地 提出 ，throw 语 句 的 EBNF 的 一 般 形式 为 


throw [表达 式 ]， 

这 里 的 方 括号 是 元 符号 ， 用 来 说 明 表 达 式 是 可 选择 的 。 没 有 操作 数 的 throw 语 句 ， 只 能 出 
现在 处 理 程序 中 。 当 throw 语 句 出 现在 处 理 程序 中 时 ， 异 常 被 重新 提出 ， 之 后 ， 这 个 异常 将 在 
别处 被 处 理 。 这 种 效果 与 Ada 中 的 完全 一 样 。 

throw 语 句 中 表达 式 的 类 型 被 用 来 选择 特定 的 处 理 程 序 ， 当 然 ， 被 选择 的 处 理 程序 必须 要 
有 匹配 的 形 参 类 型 。 在 这 里 匹配 的 含义 如 下 : 如 果 一 个 处 理 程序 的 形 参 类 型 为 TY，const T, 
T& 《对 于 类 型 ?的 对 象 的 引用 ) 或 者 const T&， 这 个 处 理 程序 与 一 个 表达 式 的 类 型 为 f 的 
throw 语 句 相 匹配 。 当 T 是 一 个 类 时 ， 如 果 一 个 处 理 程 序 的 参数 类 型 为 T， 或 者 是 为 任何 一 个 T 
的 祖先 类 ， 它 们 也 相 匹配 。thzrow 语 句 中 的 表达 式 与 形 参 的 匹配 还 有 一 些 更 加 复杂 的 情形 ， 但 
是 我 们 将 不 在 这 里 进行 描述 。 

一 个 try 结 构 中 提出 的 异常 将 即刻 终止 执行 这 个 结构 中 的 代码 。 然 后 从 紧 跟 在 try 结 构 后 
面 的 第 一 个 处 理 程序 开始 ， 搜 索 一 个 匹配 的 处 理 程序 。 这 个 搜索 匹配 的 过 程 ， 又 将 继续 到 后 面 
的 另外 一 个 处 理 程 序 ， 直 到 发 现 一 个 匹配 的 处 理 程 序 为 止 。 这 意味 着 ， 如 果 在 找到 完全 匹配 之 
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前 存在 着 其 他 的 匹配 ， 就 可 能 不 会 使 用 这 个 完全 匹配 的 处 理 程 序 。 因 此 ， 特 定 异 稍 的 处 理 函 数 
被 放置 在 列表 的 顶部， 后 面 接着 更 通用 的 处 理 函 数 。 最 后 的 处 理 函 数 通常 带 有 省 略 (.…) 的 形 
参 ， 以 匹配 任何 异常 。 这 保证 可 以 捕获 所 有 的 异常 。 

如 霖 一 条 try 子 句 提 出 一 个 异 第 ， 然 而 却 没有 匹配 的 异 第 处 理 程序 与 之 关联 。 这 时 ， 这 个 
异常 就 被 传播 。 如 有 果 这 条 try 子 句 被 嵌 套 在 另外 一 条 try 子 句 中 ， 这 个 异常 就 将 被 传播 到 与 外 
层 的 try 子 句 相关 联 的 处 理 程 序 。 如 果 所 有 的 外 层 的 try 子 句 ， 都 不 具有 相 匹 配 的 处 理 程 序 。 
这 个 异常 就 将 被 传播 到 提出 它 的 函数 之 调用 程序 。 但 如 果 这 个 调用 程序 不 具有 与 之 匹配 的 处 理 
程序 ， 此 时 就 使 用 默认 处 理 器 。 关 于 默认 处 理 器 将 在 14.3.4 小 节 中 进行 讨论 。 


14.3.3 继续 


在 一 个 处 理 程 序 完 成 执行 后 ， 控 制 将 被 转移 到 跟随 在 tzy 结 构 之 后 的 第 一 条 语句 ( 即 结构 
中 紧 接 在 最 后 一 个 处 理 程序 之 后 的 那 一 条 语句 )。 一 个 处 理 程序 能 够 使 用 一 条 不 具有 表达 式 的 
throw 语 句 来 提出 异常 ， 在 这 种 情况 下 ， 异 常 将 被 传播 。 


14.3.4 其 他 设计 选择 


就 14.12 市 中 所 总 结 的 设计 问题 而 言 ，C++ 中 的 异常 处 理 是 十 分 简单 的 。 它 仅仅 具有 用 户 定 
义 的 异常 ， 并 且 这 些 异 常 还 没有 被 说 明 (虽然 可 以 将 它们 声明 为 新 的 类 )。C++ 中 有 一 种 默认 的 
处 理 程序 ， 称 为 unexpected。 它 的 唯一 功能 就 是 终止 程序 的 执行 。 这 个 处 理 程序 捕捉 所 有 的 
役 有 被 程序 所 捕捉 的 异常 。 这 种 异常 处 理 程序 可 以 由 一 个 用 户 定 义 的 异常 处 理 程 序 来 代替 。 用 
来 替代 的 用 户 定义 的 处 理 程序 ， 必 须 是 一 个 返回 void 的 函数 ， 并 且 不 具有 参数 。 这 个 替代 函数 
是 通过 赋予 名 字 set_terminate 来 设立 。C++ 中 的 异常 不 能 够 被 禁用 。 

C++ 中 的 函数 能 够 列 出 它 所 可 以 提出 的 异常 类 型 (也 即 throw 表 达 式 的 类 型 )， 只 需要 在 函 
数 的 首部 附 上 保留 字 throw， 后 面 跟随 用 括号 括 起 来 的 类 型 的 列 。 例 如 ; 


int fun() throw (int, char *) { ... } 


它 说 明 图 数 fun 可 以 提出 然而 却 不 能 处 理 的 类 型 为 int 和 char * 的 异常 ， 但 不 会 提出 这 些 
类 型 以 外 的 异常 。thzow 子 句 的 作用 是 为 函数 的 用 户 指定 该 函数 可 能 引发 的 异常 。throw 子 名 
在 函数 和 它 的 调用 者 之 间 建 立 了 规则 。 它 保证 函数 不 引发 其 他 异常 。 如 果 函 数 抛 出 一 些 列表 中 
设 有 的 异常 ， 程 序 将 终止 。 注 意 ， 编 译 器 忽略 throw 子 句 。 

如 坟 throw 子 句 的 类 型 是 类 ， 那 么 函数 能 引发 列表 类 派生 的 任何 异常 。 如 果 函 数 的 首部 有 条 
throw), 但 它 所 提出 的 异常 没有 在 throw 子 句 中 被 列 出 , 也 不 是 由 所 列 出 的 类 所 派生 出 来 的 ， 
那么 ， 黑 认 处 理 器 就 会 被 调用 。 请 注意 ， 这 种 错误 不 可 能 在 编译 时 被 检测 出 来 。 如 果 thzow 子 名 
的 类 型 表 列 为 空 ， 这 意味 着 这 个 函数 将 不 会 产生 任何 异常 。 但 如 果 函 数 的 首部 没有 throw 的 说 明 
的 话 ， 这 个 函数 就 能 够 引发 任何 异常 。 这 个 异常 类 型 表 列 并 不 是 函数 的 类 型 中 的 一 部 分 。 

如 霖 一 个 函数 覆盖 了 有 throw 子 句 的 函数 ， 那 么 具有 比 被 覆盖 函数 更 多 异常 的 覆盖 函数 不 
能 有 throw 子 句 。 

当 一 个 弄 贡 终止 了 一 个 tzy 结 构 时 ， 在 这 个 结构 中 执行 的 代码 于 异常 发 生 之 前 所 分 配 的 所 
有 栈 动 态 和 堆 动态 的 变量 都 要 被 解除 分 配 。 从 而 ， 异 常 处 理 程序 将 无 法 存 取 这 些 变量 。 

虽然 在 C++ 中 没有 域 定义 的 异常 ， 它 的 标准 程序 库 定义 了 并 且 可 以 抛 出 异常 ， 例 如 ， 可 以 
由 程序 库 的 包含 类 来 抛 出 异常 out_of_range， 以 及 可 以 由 数学 库 的 函数 来 抛 出 异常 
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Ft LE fo FALE 
14.3.5 示例 


下 面 的 例子 与 本 章 前 面 的 14.2.5 小 节 中 的 Ada 程 序 的 例子 ， 具 有 相同 的 意图 而 且 使 用 的 是 相 
同 的 异常 处 理 的 方式 。 这 个 程序 通过 使 用 一 个 计数 器 数组 ， 来 计算 并 且 显 示 输 入 分 数 之 分 布 。 
这 个 数组 具有 10 个 不 同 分 数 类 别 。 分 数 的 值 被 用 来 作为 计数 器 的 下 标 。 非 法 的 输入 的 分 数 ， 通 
过 增加 选择 计数 器 来 检测 无 效 的 下 标 ， 从 而 得 以 发 现 。 [618] 


// 分 数 的 分 布 
// 输 入 :一 列表 示 分 数 的 整数 值 ， 后 跟 
// 一 个 负数 
// 输 出 :分 数 分 布 情况 ,分 数 等 级 
(0-9, 10~19. .05 +y 90~100) 
#include <iostream.h> 
void main() { //* Any exception can be raised 
int new grade, 
index, 
limit 1, 
limit 2, 
freg{10] = {0,0,0,0,0,0,0,0,0,0}; 
// The exception definition to deal with the end of data 
class NegativeInputException { 
public: 
NegativeInputException() { //* Constructor 
cout << "End of input data reached" << endl; 
} //** end of constructor 
} //** end of NegativeInputException class 
try { 
while (1) { 
cout << "Please input a grade" << endl; 
if ((cin >> new grade) < 0) //* Terminating condition 
throw new NegativeInputException(); 
index = new grade / 10; 
{try { 
if (index > 9) 
throw new _grade; 
freq[ index ]++; 
} //* end of inner try compound 
catch(int grade) { //* Handler for index errors 
if (grade == 100) 
freq[9]++; 
else 
cout << "Error -- new grade: " << grade 
<< " is out of range" << endl; 
} //* end of catch(int grade) 
} //* end of the block for the inner try-catch pair 
} //* end of while (1) 
} //* end of outer try block 
catch(NegativeInputException e) { //** Handler for 
//** negative input 
cout << "Limits Frequency" << endl; 
for (index = 0; index < 10; index++) { 
limit_1 = 10 * index; 
limit 2 = limit 1 # 9; 
if (index == 9) 
limit 2 = 100; 
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cout << limit_1 << limit_2 << freq[index] << endl; 
} //* end of for (index == 9) 
} //* end of catch (short int) 
} //* end of main 


我 们 使 用 这 个 程序 是 为 了 说 明 C++ 中 的 异常 处 理 机 制 。 然 而 ， 这 个 例子 中 处 理 异常 的 两 种 方 
式 ， 都 可 以 通过 使 用 别 的 更 好 的 方法 来 进行 。 使 用 cin 表 达 式 来 控制 while 循 环 ， 可 以 更 容易 处 理 
文件 结尾 ”的 情况 。 此 外 在 Ct++ 中 ， 下 标 范围 异常 通常 是 由 重 载 下 标 操 作 来 处 理 的 ， 然 而 这 种 方 
法 还 可 以 提出 异常 ， 而 不 是 像 在 我 们 的 示例 中 的 那样 ， 使 用 选择 结构 来 进行 下 标 操 作 的 直接 检测 。 


14.3.6 评估 


C++ 的 异常 处 理 机 制 在 一 些 方 面 与 Ada 的 异常 处 理 机 制 相 类 似 ， 异常 和 异常 处 理 程序 的 绑 定 
都 是 静态 的 ， 并 且 都 将 所 不 能 够 处 理 的 异常 传播 给 函数 的 调用 程序 。 然 而 在 其 他 的 一 些 方面 ，C++ 
中 的 设计 则 是 相当 不 同 的 : 它 不 具有 内 建 的 、 能 够 被 硬件 检测 的 并 且 能 够 由 用 户 来 处 理 的 异常 ， 
以 及 不 能 够 给 异常 命名 。 异 常 通过 参数 类 型 与 处 理 程序 相连 接 ， 但 形 参 又 可 以 不 存在 。 处 理 程 序 
中 的 形 参 类 型 决定 调用 处 理 程序 的 条 件 ， 但 是 又 与 处 理 程序 所 提出 的 异常 的 性 质 毫 不 相干 。 因 而 ， 
使 用 异常 的 预定 义 类 型 并 不 能 够 改进 可 读 性 。 如 果 能 够 在 一 种 有 意义 层次 结构 中 使 用 有 意义 的 名 
字 来 定义 蜡 党 类， 情况 将 会 好 得 多 。 异 常 参 数 提供 了 一 种 传递 异常 信息 给 异常 处 理 函 数 的 方法 ， 


14.4 Java 中 的 异常 处 理 


在 第 13 章 中 ， 曾 经 在 Java 的 示例 程序 里 包括 了 异常 处 理 的 应 用 ， 然 而 当时 并 没有 进行 任何 
解释 。 在 这 一 节 里 ， 我 们 将 详细 描述 Java 的 异常 处 理 功能 。 

Java 中 的 异常 处 理 是 以 C++ 的 异常 处 理 为 基础 的 ， 但 它 的 设计 与 面向 对 象 语言 的 风格 更 为 
接近 。 此 外 ，Java 中 还 包括 了 一 组 由 Java 的 虚拟 机 器 所 隐 式 提出 的 预定 义 异常 。 


14.4.1 异常 类 


Java 中 的 所 有 异常 都 是 对 象 ， 这 些 异 常 的 类 都 是 Throwable 类 的 后 裔 。 Java 系 统 中 包括 了 
两 种 系统 定义 的 异常 类 ，Error 和 Exception,， 这 两 个 类 都 是 Throwable 的 子 类 。Error 类 
及 其 后 裔 类 ， 都 与 Java 虚 拟 机 器 所 抛 出 的 错误 相关 ， 例 如， 已 经 没有 了 堆 存 储 器 空间 。 这 些 异 
和 前 从 来 不 会 由 用 户 程序 来 抛 出 ， 因 而 也 就 不 应 该 在 用 户 程序 之 中 处 理 。Bxception 具 有 两 个 系 
SE MN Aa ff: RuntimeException 和 IOException。 正 如 这 两 个 名 字 所 指示 的 ， 当 在 
答 入 或 输出 操作 中 发 生 错误 时 ，IOException 被 抛 出 ， 所 有 的 输入 与 输出 操作 ， 都 被 定义 为 
包 java.io 中 定义 的 各 种 类 方法 。 

还 有 预定 义 的 RuntimeException 的 后 裔 类 。 在 大 部 分 情况 下 ， 当 由 用 户 程序 引起 错误 
FF, RuntimeException 则 被 Java 虚 拟 机 器 抛 出 。 例 如 ， 在 java.uti1l 中 所 定义 的 
ArraylndexOutOfBoundsException, 就 是 一 个 经 常 被 抛 出 的 异常 ; 这 个 异常 是 
RuntimeException 的 后 裔 。 另 外 一 个 经 常 被 抛 出 的 RuntimeException 的 后 裔 异常 是 
NullPointerException, 

用 户 程 序 可 以 定义 自己 的 异常 类 。 Java 中 的 约定 为 凡是 用 户 定 义 的 异常 都 是 Exception 的 
FX, 


14.4.2 异常 处 理 程序 
Java 的 异常 处 理 程序 ， 与 C++ 中 的 异常 处 理 程序 有 着 相同 的 形式 ， 只 是 其 中 的 每 一 个 
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catch 都 必须 具有 参数 ， 而 且 这 些 参 数 的 类 型 必须 是 预定 义 类 Throwable 的 子 类 。 
除了 在 14.4.6 小 节 中 所 描述 的 finally 子 句 外 ，Java 中 的 try 结 构 的 语法 ,与 C++ 中 的 完 


全 相同 。 
14.4.3 异常 与 异常 处 理 程序 的 绑 定 


抛 出 一 个 异常 十 分 人 简单。 只 要 将 异常 类 的 一 个 实例 作为 throw 语 句 的 操作 数 来 给 出 。 例 如 ， 
假设 我 们 定义 一 个 被 命名 为 MyException 的 异 第 ， 如 下 : 

class MyException extends Exception { 
public MyException() {} 
public MyException(String 消息 ) { 

super (ÑE); 

« 3 
} 
能 够 使 用 下 面 的 语句 来 抛 出 这 个 异常 : 
throw new MyException(); 
也 可 以 将 throw 语 句 与 创建 throw 的 异常 实例 分 开 来 进行 ， 例 如 ， 


MyException myExceptionObject = new MyException(); 


throw myExceptionObject; 


在 我 们 的 新 的 类 中 所 包含 的 两 个 构造 器 ， 其 中 的 一 个 不 具有 参数 ， 而 另外 的 一 个 则 具有 一 
个 String 对 象 的 参数 ， 这 个 参数 被 送 给 超 类 的 Exception， 并 且 由 Exception 来 显示 这 个 参 
数 。 因 而 我 们 的 新 异常 可 以 通过 下 面 的 语句 来 抛 出 : 

throw new MyException ("一 条 说 明 错 误 出 现 的 地 址 的 相信 " ) 3 


在 Java 中 ， 蜡 向 与 异常 处 理 程序 的 绑 定 没有 C++ 中 的 那么 复杂 。 如 果 一 个 异常 是 在 tzy 结 
构 的 复合 语句 之 中 被 抛 出 的 话 ， 这 个 异常 就 与 紧 接 在 这 个 tzy 子 名 后面 的 第 一 个 异常 处 理 程 
Fe (catchy) 相 绑 定 ， 这 个 国 数 的 参数 与 被 抛 出 的 对 象 具 有 相同 的 类 或 与 被 抛 出 的 对 象 
的 祖先 相同 的 类 。 如 果 发 现 了 一 个 相 匹配 的 处 理 程序 ，throw 就 与 之 绑 定 ， 并 且 执 行 这 个 处 
理 程 序 。 

可 以 在 一 个 处 理 程序 的 尾部 ， 包 括 不 具有 操作 数 的 throw 语 句 ， 这 样 就 可 以 进行 异常 的 处 
理 ， 并 在 处 理 之 后 重新 抛 出 异常 。 新 抛 出 的 异常 不 会 在 原来 抛 出 它 的 同一 条 try 子 句 中 处 理 ， 
因此 循环 将 不 是 一 个 问题 。 重 新 抛 出 异常 ， 通 常 是 当 需 要 一 些 局 部 的 行为 ， 然 而 异常 又 是 由 一 
个 包含 的 try 子 句 、 或 调用 函数 来 处 理 时 。 处 理 程序 中 的 一 条 throw 语 句 可 以 抛 出 一 个 异常 ， 
而 不 是 将 控制 转移 给 处 理 程序 的 这 种 异常 。 

为 了 确保 try 子 句 中 所 抛 出 的 异常 总 能 在 一 个 方法 中 来 处 理 ， 可 以 编写 一 个 特殊 的 处 理 程 序 
匹配 从 Exception 中 派生 出 来 的 所 有 的 异常 ， 这 个 处 理 程序 的 参数 类 型 就 是 Exception， 如， 


catch (Exception genericObject) { 


} 

因为 一 个 类 总 是 与 自身 或 任何 祖先 类 相 匹 配 ， 从 Exception 中 派生 的 任何 类 都 与 
Exception 相 匹配 。 当 然 ， 总 是 将 这 样 的 异常 处 理 程序 放置 于 处 理 程序 序列 的 末尾 ， 否 则 它 将 
阻止 使 用 ， 在 同一 个 try 结 构 中 排 在 这 个 处 理 程序 后 面 的 处 理 程序 。 因 为 匹配 处 理 程序 的 搜寻 
是 顺序 的 ， 并 且 这 种 搜寻 总 是 结束 于 发 现 了 一 个 匹配 处 理 程序 之 时 。 


ON 
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14.4.4 其 他 设计 选择 


在 执行 一 个 程序 时 ，Java 的 运行 时 系统 将 程序 中 每 一 个 对 象 的 类 的 名 称 存储 起 来 。 可 以 使 
用 getcClass 方 法 来 得 到 一 个 存储 类 名 称 的 对 象 ， 而 类 名 称 的 本 身 则 能 够 通过 使 用 getName 方 
法 来 获得 。 因 此 我 们 就 能 够 检索 到 来 自 throw 语 句 的 、 引 起 处 理 器 执行 的 实 参 的 类 的 名 称 。 对 
于 上 面 的 处 理 程序 ， 可 以 这 样 来 获得 类 名 称 : 

genericObject.getClass().getName( ) 

参数 对 象 由 构造 器 创建 ， 可 以 通过 下 面 的 方式 来 获得 与 参数 对 象 相关 的 消息 ， 

genericObject.getMessage( ) 

此 外 ， 在 用 户 定义 的 异常 情况 下 ， 所 抛 出 的 对 象 可 以 包括 对 于 处 理 程序 可 能 有 用 的 任意 数 
目的 数据 成 员 。 

Java 中 的 throws 子 句 的 外 表 以 及 它 在 程序 中 的 放置 ， 与 C++ 中 的 thzow 说 明 的 相 类 似 。 然 
而 Java 的 throws 子 句 的 语义 却 完全 不 同 于 C++ 中 的 throw 说 明 ，。 

在 一 个 Java 方 法 的 throws 子 句 中 出 现 的 一 个 异常 类 的 名 称 ， 说 明 这 个 方法 可 以 抛 出 这 个 
异 弟 类 或 它 的 任何 后 诊 异 常 类。 例如， 当 一 个 方法 说 明 它 能 够 抛 出 IOException 时 ， 这 意味 
着 这 个 方法 能 够 抛 出 IOException 对 象 或 者 它 的 任何 后 裔 类 的 对 象 ， 如 EOFException 的 
对 象 ， 并 且 它 不 处 理 它 抛 出 的 异常 。 

类 异 芝 Error 与 RuntimeException 以 及 它们 的 后 裔 ， 被 称 为 不 检测 的 异常 (unchecked 
exception)。 所 有 其 他 的 异常 都 被 称 为 要 检测 的 异常 (checked exception)。 编 译 器 从 不 关心 不 检 
测 的 异常 。 然 而 ， 编 译 器 却 必 须 保证 能 够 被 方法 所 抛 出 的 要 检测 的 异常 ， 要 么 是 在 throws 子 
句 中 出 现 ， 要 么 是 在 方法 中 被 处 理 。Error 和 RuntimeException 类 异常 及 其 后 裔 不 被 检测 


:的 原因 ， 是 因为 任何 方法 都 可 以 抛 出 这 些 异常 。 可 以 有 一 个 程序 来 捕捉 不 检测 的 异常 ， 然 而 并 


不 要 求 这 样 做 。 

正如 C++ 的 例子 ， 在 一 个 方法 的 throws 子 句 中 所 声明 的 异常 ， 不 能 够 多 于 它 所 覆盖 的 方法 
中 的 throws 子 名 中 所 声明 的 异常 ， 当 然 ， 它 所 声明 的 异常 可 以 少 于 它 所 覆盖 的 方法 所 声明 的 
异 第 。 一 个 方法 能 够 抛 出 其 throws 子 句 中 所 列 出 的 任何 异常 ， 连 同 这 个 异常 的 后 诊 类 ， 

如 采 一 个 方法 不 直接 抛 出 某 种 特定 异常 ， 但 是 调用 另外 一 个 可 以 抛 出 这 个 异常 的 方法 ， 这 
个 方法 就 必须 将 这 个 异常 列 入 它 的 throws 子 句 中 。 这 就 古 在 下 面 的 示例 中 使 用 readLine 方 法 
的 buildDist 方 法 ， 必须 在 首部 的 throws 子 句 中 说 明 IOException 的 原因 

一 个 不 包含 throws 子 句 的 方法 不 能 传播 任何 要 检测 的 异常 。 在 C++ 中 ， 没 有 throws 子 名 
的 函数 抛 出 任何 异常 。 

当 一 个 方法 调用 另外 一 个 方法 ， 而 后 者 将 一 个 要 检测 的 异常 列 在 其 throws 子 句 中 ， 那 么 
这 个 方法 就 具有 三 种 可 能 的 方式 来 处 理 这 个 异常 : 第 一 ， 它 能 够 捕捉 这 个 异常 并 进行 处 理 ， 第 
一 ， 它 能 够 捕捉 这 个 异常 并 且 抛 出 一 个 列 于 自己 的 throws 子 句 中 的 异常 ， 第 三 ， 它 可 以 在 自 
已 有 的 throws 子 句 中 声明 这 个 异常 ， 但 并 不 进行 处 理 ， 这 实际 上 就 是 将 异常 传播 到 一 个 包含 它 
的 try 子 句 中 ， 如 果 这 种 try 子 名 存在， 或 者 ， 在 不 存在 包含 它 的 try 子 句 的 情况 下 ， 将 异常 传 
播 到 调用 它 的 方法 中 去 。 

Java 中 没有 默认 的 异常 处 理 程序 ， 因 而 不 可 能 禁用 异常 Java 中 的 继续 与 C++ 中 的 一 模 
一 样 。 
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Java 的 诞生 


JAMES GOSLING 

James Gosling 是 Sun 公 司 的 资深 研究 员 和 副 总 裁 ，Java 程 序 设计 语言 的 创始 人 ， 
也 是 计算 机 界 最 有 名 的 程序 员 之 一 。 他 是 1996 年 软件 开发 程序 设计 优秀 奖 的 获奖 
e 者 。Gosling 开 发 了 NeWS, Sun 公 司 的 网 络 可 扩展 视窗 系统 。 他 曾经 是 卡 内 基 - 梅 
他 一， 隆 大 学 的 Andrew 项 目的 主要 成 员 。Gosling 在 卡 内 基 . 梅 隆 大 学 获得 了 计算 机 科学 





博士 学 位 。 

个 人 简 史 

问 : 你 是 怎样 涉足 到 计算 器 领域 的 ? 

E: 在 我 十 四 岁 那 年 ， 一 个 朋友 的 父亲 带 我 去 参观 Calgary 大 学 的 计算 机 设施 ， 我 就 被 吸引 住 了 。 可 
以 说 ， 第 一 眼 我 就 喜欢 上 了 计算 机 。 然 后 我 开始 自学 程序 设计 。 读 高 中 时 在 Calgary 大 学 物理 系 得 到 一 份 
工作 。 此 后 ， 从 那里 开始 就 像 滚雪球 一 样 滚 到 现在 。 

Fl: 你 的 第 一 份 计算 机 方面 的 工作 是 什么 ? 

Z: 在 Calgary 大 学 物理 系 为 ISIS-I 卫 星 编写 软件 。 

lA): 你 最 喜欢 的 工作 是 什么 ? 

E: 我 的 第 一 份 工 作 很 特殊 。 但 我 也 很 喜欢 我 现在 的 工作 ， 在 Sun 公 司 的 研究 实验 室 作 研究 员 。 我 正 
式 的 职位 是 “ 副 总 裁 和 资深 研究 员 ”。 

JAVA: 一 种 程序 设计 语言 的 诞生 

问 : 许多 语言 的 诞生 都 是 别 的 目标 的 副产品 。 我 听 说 Java 和 “绿色 项 目 ” 也 是 这 样 的 。 你 能 告诉 我 们 
这 个 故事 吗 ? 

E: 我 们 一 个 小 组 当时 正 研究 有 可 能 对 Sun 公 司 产生 影响 的 未 来 发 展 趋势 。 我 们 很 快 就 将 注意 力 集 中 
在 与 网 络 相关 的 非 计 算 机 设备 〈 如 移动 电话 、 电 视 、 控 制 系统 等 ) 中 的 数码 系统 的 使 用 上 。 我 们 开始 建造 
了 一 个 样机 设备 来 学 习 这 个 领域 。 我 们 在 使 用 的 基本 程序 设计 工具 中 遇 到 不 少 问题 。 我 在 那个 项 目 中 的 工 
作 最 后 变 成 解决 工具 的 问题 。 最 后 的 成 果 就 是 Java。 

lp]: 为 什么 要 创建 一 种 语言 ? 

E: 因为 别 的 语言 都 不 行 。 第 一 个 样机 是 用 C++ 写 的 。 在 那 以 前 我 们 考虑 过 并 否决 了 许多 其 他 的 语 
言 。 它 们 在 二 进 制 码 的 层次 上 太 依赖 于 CPU 体系 结构 ， 并 很 少 考虑 安全 性 。 不 用 说 ， 它 们 还 有 一 些 可 靠 
性 问题 。 

IF]: 你 把 Simula 说 成 是 Java 的 先驱 者 。 为 什么 是 Simula? 

E: 它 是 最 早 的 面向 对 象 的 语言 。 在 过 去 的 几 年 中 ， 我 用 Simula 用 得 很 多 。 相 对 C 和 C++， 它 是 单 继 
涉 ， 并 有 紧凑 的 存储 器 模型 。 

问 : 哪些 特征 使 得 Java 与 那些 受 欢迎 语言 不 一 样 ? 

A: 效率 、 可 靠 性 、 安 全 性 和 可 移植 性 。 

J: 这 些 特征 和 当前 硬件 软件 的 发 展 趋势 对 Java 的 成 功 起 了 多 少 作用 ? 

答 : 很 多 。 

JAVA: 命名 

Fh]: 为 什么 你 原先 的 项 目 称 为 “绿色 项 目 ”? 

E: 没有 什么 好 的 理由 。Apple 有 一 个 “粉色 项 目 ”， 人 们 用 颜色 来 命名 该 项 目 。 我 们 项 目的 名 字 来 自 
于 我 们 工作 的 办 公 室 套间 的 门 的 颜色 ， 那 是 一 扁 绿 门 。Java 原 来 的 名 称 为 “橡树 ”。 当 在 我 挑选 这 个 名 字 
时 ， 眼 睛 正 盯 着 窗外 ， 那 时 窗外 长 着 一 棵 橡树 ， 但 是 原来 的 那个 名 字 与 别人 的 商标 有 着 种 种 冲突 。 律 师 们 
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就 要 我 们 找 出 一 个 没有 问题 的 名 字 。 


么 ? 


H: 你 已 经 厌倦 了 Java 这 个 名 字 吗 ? 

答 : 没有 。 

a): 如 果 你 今天 能 给 Java 取 另外 一 个 名 字 ， 你 会 给 它 什 么 名 字 ? 
答 : 这 个 问题 太 难 了 。 挑 选 名 字 很 难 。 

JAVA: 过 去 、 现 在 和 将 来 





Al: 如 果 你 能 够 回 到 过 去 并 改变 Java 的 两 个 特征 ， 或 者 是 重新 来 创建 它们 ， 那 会 是 怎样 的 两 个 特征 ? 


答 : 轻 对 象 和 switch 语 句 。 
问 : 你 曾经 思考 过 要 进行 这 样 的 工作 吗 ? 
丛 : 是 的 。 


问 : 回头 看 看 你 们 当年 在 “绿色 项 目 ” 中 所 企图 创建 的 东西 ， 今 天 这 样 的 设备 还 有 吗 ? 当年 你 们 所 
走 的 路 线 正 确 吗 ? 


答 : 是 的 。Palm Pilot 和 摩登 、 精 巧 的 手机 ， 正 是 我 们 当年 的 方向 。 


A]: 如 果 今 天 安排 你 去 做 类 似 于 “绿色 项 目 ” 的 工作 ， 你 会 将 你 的 精力 集中 在 什么 样 的 用 户 功 能 
E? 或 者 说 ， 如 果 互 联网 和 Java 是 20 世 纪 90 年 代 初 期 有 的 “伟大 的 ”工具 ,下 一 个 “伟大 的 ”工具 是 什 


答 : 下 一 个 “伟大 的 ”工具 没有 变 





答 ， 推理 和 验证 。 
H: 如果 你 没有 从 事 现在 的 工作 ， 你 会 做 些 什么 ? 


14.4.5 一 个 示例 


下 面 是 Java 的 类 ， 它 具有 与 在 14.3.5 市 中 的 C++ 程 序 同样 的 功能 : 


/ /分数 的 分 布 
// 输 入 :一 列表 示 分 数 的 整数 值 , 后跟 一 个 负数 
// 输 出 :分 数 分 布 情况 ,分 数 等 级 (0~9， 10~19, eee ,90~100) 


import java.io.*; 


// 处 理 数据 尾部 的 异常 定义 
class NegativeInputException extends Exception { 
public NegativeInputException() { 
System.out.println("End of input data reached"); 
} //** 结构 体 结束 
} //** NegativeInputException 类 结束 


class GradeDist { 
int newGrade, 
index, 
limit 1, 
Limit 2; 
int [] freq,= {0, 0; Dy QO 0; 0; Ds 0, 0, 0}; 


void buildDist() throws IOException { 
DataInputStream in = new DataInputStream(System.in); 


try { 
while (true) { 


仍然 是 互联 网 。 我 们 至 今 其 至 还 没有 开始 发 据 它 。 
lA]: 往 前 跳跃 15 年 ， 那 时 的 程序 设计 语言 会 提供 哪些 它们 现在 所 没有 提供 的 功能 ? 


答 : 任何 涉及 创建 东西 的 事情 。 
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System.out.println("Please input a grade"); 
newGrade = Integer.parseInt(in.readLine()); 
if (newGrade < 0) 
throw new NegativeInputException(); 
index = newGrade / 10; 
try { 
freq[index]++; 
} //** 内 部 try 语句 结束 
catch(ArrayIndexOutOfBoundsException) { 
if (newGrade == 100) 
freq [9]++; 
else 
System.out.println("Error - new grade: " + 
newGrade + " is out of range"); 
} //** catch (ArrayIndex... 结束 
} //** while (true) ... 结束 
} {/** Shah try 语 凶 结 来 
catch(NegativeInputException) { 
System.out.println ("\nLimits Frequency\n"); 
for (index = 0; index < 10; index++) { 
limit 1 = 10 * index; 
Limit 2 = limit 1 + 9; 
if (index == 9) 
limit 2 = 100; 
System.out.println("" + limit 1+" - "+ 
LIMIE 2 + * " + freq [index]); 
} //** for (index = 0; ... 结束 
} //** catch (NegativeInputException ... 结束 
} //** method buildDist 结束 


在 这 个 程序 中 定义 了 因为 负 输 入 而 发 生 的 异常 NegativelnputException。 当 这 个 类 的 
一 个 对 象 被 抛 出 时 ， 它 的 构造 器 显示 出 一 条 消息 。 它 的 处 理 程序 产生 方法 的 输出 。 
ArraylndexOut0OfBoundsException 是 预定 义 的 ， 并 由 Java 虚 拟 机 器 抛 出 。 在 这 两 种 情况 
下 ， 处 理 程序 都 不 在 它 的 参数 中 包括 对 象 的 名 称 。 因 为 在 这 两 种 情形 下 ， 对 于 任何 目的 ， 名 称 
都 是 没有 用 的 。 注 意 ， 所 有 的 处 理 器 都 是 获取 对 象 来 作为 参数 ， 然 而 这 些 参数 常常 是 没有 什么 
用 途 的 。 


14.4.6 finally 


在 有 些 情 况 下 必须 执行 一 个 过 程 ， 而 不 论 一 条 try 子 句 是 否 抛 出 了 一 个 异常 ， 也 不 论 是 否 
在 一 个 方法 中 捕获 了 这 个 被 抛 出 的 异常 。 关 于 这 种 情形 的 一 个 例子 ， 就 是 必须 要 关闭 一 个 文件 
的 情形 。 另 外 一 个 例子 就 是 ， 如 果 一 个 方法 占有 某 种 外 部 资源 ， 而 不 论 这 个 方法 的 执行 是 怎样 
结束 的 ， 都 必须 释放 这 些 资 源 。final1y 子 句 就 是 为 这 些 类 型 的 需要 而 设计 的 。final1ly 子 名 
饺 放 置 在 try 结 构 之 后 的 处 理 程序 列表 的 末尾 。 一 般 而 言 ，try 结 构 与 finally 子 句 的 位 置 关 
系 如 下 所 示 : 

try { 

} 

Catch (sia) { 


} 
。 //** 更 多 的 处 理 程序 
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finally { 

a 

这 种 结构 的 语义 为 : 如果 try 子 句 没 有 抛 出 一 个 异常 ， 在 执行 try 结 构 后 的 语句 之 前 就 执 
行 finally 子 句 ， 如 果 try 子 句 抛 出 了 一 个 异常 ， 并 且 这 个 异常 被 try 结 构 中 的 一 个 处 理 程序 
所 捕获 ， 在 处 理 程序 完成 执行 后 ， 就 执行 fijnally 子 句 ， 如 果 try 子 句 抛 出 一 个 异常 ， 但 是 这 
个 异 肖 没有 被 try 结 构 中 的 任何 处 理 程序 所 捕获 ， 在 异常 被 传播 之 前 ， 执 行 EinalL1Ly 子 句 。 

一 个 没有 异常 处 理 程序 的 try 结 构 ， 后 面 可 以 跟随 一 个 finally 子 句 。 当 然 ， 这 只 有 在 复 
合 语句 中 具有 break、continue 或 return 语 句 时 才 存 在 意义 。 在 这 些 情况 下 ， 它 的 目的 与 它 
和 异常 处 理 在 一 起 使 用 时 是 相同 的 。 例 如 ， 我 们 可 以 有 下 面 的 代码 : 

try 1 


for (index = 0; index < 100; index++) { 


if {ens J 4 
return; 
} //** 结束 if 语句 


} //** 结束 for 语 名 
} //** 结束 try 子 句 
finally { 


} //** 结束 try 结 构 


不 论 这 里 的 循环 是 由 return 终 止 的 还 是 正常 结束 的 ， 都 将 执行 finally 子 句 。 
14.4.7 断言 


在 第 2 章 讨论 Plankalkiil 语 言 时 ， 我 们 曾经 提 到 过 ， 这 种 语言 包含 了 断言 。 在 Java 1.4 版 本 中 
也 增加 了 断言 。 然 而 在 这 个 版 本 中 的 默认 情况 下 ， 断 言 是 停 用 的 。S 要 使 用 断言 ， 必 须 在 执行 
程序 时 ， 使 用 enableassertions (或 ea) 选择 来 启用 它们 。 例 如 : 

java -enableassertions MyProgram 

两 种 可 能 的 assert 语 句 的 形式 为 : 

assert 条 件 ; 

assert 条 件 :表达 式 ; 

如 霖 是 使 用 第 一 种 形式 ， 当 执行 达到 assert 语 句 时 ， 条 件 就 被 检测 。 如 果 条 件 为 真 ， 什 
么 也 不 进行 ， 如 果 条 件 为 假 ， 就 抛 出 AssertionError 的 异常 。 如 果 是 使 用 第 二 种 形式 ， 系 统 
的 行为 将 是 一 样 的 ， 除 了 会 将 表达 式 的 值 作为 字符 串 传递 给 AssertionError 的 构造 程序 ， 并 
成 为 程序 除 错 而 输出 以 外 。 

assert 语 句 被 用 于 防 错 性 的 程序 设计 。 在 一 个 程序 中 可 以 使 用 多 条 assert 语 句 ， 以 便 确 
保 程序 的 计算 能 够 沿 着 正确 轨道 来 产生 正确 的 结果 。 很 多 程序 即使 在 使 用 不 具有 断言 的 语言 时 ， 
也 在 程序 中 加 入 这 种 检测 以 帮助 除 错 。 在 程序 经 过 了 充分 的 检测 后 ， 就 将 这 些 检测 删除 。 
assert 语 句 的 作用 与 这 些 检 测 是 一 样 的 。assert 语 句 所 具有 的 优点 是 可 以 将 它们 停 用 ， 而 不 
需要 将 它们 语句 一 个 个 地 从 程序 中 删除 。 这 样 不 但 节省 了 删除 这 道 工序 ， 而 且 还 可 以 在 子 程序 
的 维护 过 程 中 再 使 用 这 些 语 句 。 

© Java 5.0 默 认 该 功能 。 
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14.4.8 评估 


Java 中 的 异常 处 理 机 制 以 C++ 的 版 本 为 基础 ， 并 且 进 行 了 一 些 改进 。 

首先 ， 一 个 C++ 的 程序 能 够 抛 出 任何 定义 于 程序 中 的 或 者 是 由 系统 所 定义 的 类 型 。 而 在 
Java 中 ， 只 能 够 抛 出 Thrzowab1le 及 其 后 裔 类 的 对 象 。 这 样 就 将 能 够 被 抛 出 的 对 象 与 所 有 其 他 寄 
居于 程序 中 的 对 象 (及 非 对 象 ) 区 别 开 来 。 如 果 一 个 异常 只 是 引起 一 个 int 数 值 被 抛 出 ， 那 有 
什么 意义 ? 

其 次 ， 一 个 没有 包括 throws 子 句 的 C++ 程序 单位 能 够 抛 出 任何 异常 ， 但 并 不 通知 程序 的 读 
者 。 在 Java 中 ， 一 个 没有 包括 throws 子 名 的 方法 ， 不 能 够 抛 出 任何 它 所 不 能 够 处 理 的 要 检测 的 
异常 。 因 此 ，Java 的 方法 的 读者 能 够 从 方法 的 首部 知道 它 可 以 抛 出 哪些 它 所 不 能 够 处 理 的 异常 。 
虽然 C+t+ 编 译 器 忽略 throws 子 句 ， 但 是 Java 编 译 器 使 方法 能 抛 出 的 所 有 异常 都 列 在 throws 子 
句 中 。 

再 次 ， 所 增加 的 final1y 子 句 在 某 些 情形 下 能 够 提供 极 大 的 方便 。 它 允许 采取 某 些 行动 ， 
而 不 论 一 条 复合 语句 是 如 何 终止 的 。 

最 后 ，Java 的 运行 时 系统 隐 式 地 抛 出 多 种 异常 ， 例 如 ， 数 组 下 标 越界 和 存 取 空 的 引用 变量 ， 
这 些 都 能 够 被 任何 用 户 程 序 来 处 理 。C++ 程 序 却 只 能 够 处 理 它 所 显 式 抛 出 的 异常 (或 由 它 使 用 
的 库 类 抛 出 )。 

Java 的 异常 处 理 的 功能 对 比 Ada 中 的 异常 处 理 ， 它 们 基本 上 是 相当 的 。Java 方 法 中 的 
throws 子 句 有 助 于 可 读 性 ， 然 而 Ada 则 没有 与 这 种 子 句 相对 应 的 特性 。 就 允许 程序 处 理 系 统 检 
测 的 异常 的 方面 而 言 ， 比 较 Ada 与 C++ 中 的 异常 处 理 ，Java 肯 定 更 加 接近 于 Ada。 

C# 中 所 包括 的 异常 处 理 的 结构 十 分 类 似 于 Java 中 的 ， 除 了 C# 不 具有 throws 子 句 之 外 。 


14.5 事件 处 理 概 述 


事件 处 理 与 异常 处 理 相 类 似 。 在 这 两 者 中 都 是 当 某 个 事件 (异常 或 者 事件 ) 发 生 时 ， 处 理 
如 束 被 隐 式 地 调用 。 所 不 同 的 是 ， 异 常 是 由 用 户 程序 显 式 地 产生 ， 或 者 是 由 硬件 或 软件 解释 器 
隐 却 地 产生 。 而 事件 则 是 由 外 部 行动 来 产生 ， 例 如 ， 用 户 通 过 图 形 接口 与 程序 的 互动 。 本 小 节 
将 介绍 事件 处 理 的 基本 概念 。 事 件 处 理 远 没有 异常 处 理 那 么 复杂 。 

在 传统 的 〈 非 事件 驱动 的 ) 程序 设计 中 ， 代 码 本 身 就 说 明代 码 被 执行 的 顺序 ， 尽 管 执 行 顺 
序 通 前 还 受到 程序 输入 数据 的 影响 。 在 事件 驱动 的 程序 设计 中 ， 程 序 的 许多 部 分 是 在 完全 不 可 
预料 的 时 刻 被 执行 的 。 这 些 程序 部 分 的 执行 ， 是 由 用 户 与 正在 执行 的 程序 的 互动 所 激发 的 。 

本 章 所 讨论 的 事件 处 理 ， 都 与 图 形 用 户 接口 有 关 。 因 此 ， 大 多 数 的 事件 都 是 通过 图 形 对 象 
(常常 称 为 widget) 的 用 户 的 互动 而 产生 的 。 最 常见 的 widget 的 例子 就 是 按钮 。 对 于 用 户 通 过 图 
形 接口 所 产生 互动 的 反应 是 事件 处 理 最 常见 的 一 种 形式 。 

事件 (event) 就 是 通知 某 个 特定 的 事情 已 经 发 生 ， 例 如 ， 鼠 标 在 按钮 上 的 点 击 。 严 格 来 说 ， 
至 少 古 在 这 里 所 讨论 的 事件 处 理 中 : 一 个 事件 是 一 个 对 象 , 它 由 运行 时 系统 对 于 用 户 行动 作出 的 
反应 来 产生 。 

事件 处 理 器 (event handler) 是 对 于 事件 作出 响应 时 所 执行 的 一 段 代 码 。 事 件 处 理 器 使 得 程 
序 能 够 对 于 用 户 行动 作出 反应 。 

虽然 事件 驱动 的 程序 设计 在 图 形 用 户 界 面 (GUI) 出 现 之 前 很 久 就 已 经 被 使 用 了 ， 但 是 只 
有 在 用 于 广泛 流行 的 图 形 界面 时 ， 它 才 成 为 了 一 种 广泛 使 用 的 程序 设计 方法 学 。 例 如 ， 考 虑 显 
未 给 万 维 网 浏览 器 用 户 的 图 形 界面 。 现 在 许多 给 万 维 网 浏览 器 用 户 显 示 的 文档 都 是 动态 的 。 这 
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样 的 文档 可 以 给 用 户 显示 订购 表单 。 用 户 通过 点 击 按钮 来 选择 货物 。 在 响应 按钮 的 点 击 时 所 需 
的 内 部 计算 就 由 一 个 事件 处 理 器 来 进行 。 这 个 事件 处 理 器 将 对 点 击 事件 作出 反应 。 

事件 处 理 器 的 另外 的 一 常见 的 应 用 是 在 表单 更 改 或 在 表单 被 提交 给 服务 器 时 ， 检 测 表单 元 
素 中 的 简单 错误 及 遗漏 。 使 用 浏览 器 中 的 事件 处 理 器 来 检测 表单 数据 的 有 效 性 ， 可 以 市 约 将 数 
据 送 往 服务 器 的 时 间 ， 此 后 ， 服 务 器 中 内 居 的 程序 或 脚本 将 在 数据 被 处 理 之 前 进行 正确 性 的 检 
测 。 浏 览 器 中 的 事件 驱动 的 程序 设计 常常 使 用 客户 端的 脚本 语言 ， 如 JavaScript。 


14.6 Java 的 事件 处 理 


Java 支 持 两 种 不 同 的 方法 ， 将 交互 显示 呈现 给 用 户 或 者 应 用 程序 ， 或 者 小 应 用 程序 applet。 
这 两 者 都 使 用 相同 的 类 来 定义 GUI 的 成 分 ， 以 及 使 用 相同 的 事件 处 理 右 来 提供 交互 。 虽 然 我 们 
在 这 里 仅仅 讨论 applet， 这 一 小 节 的 内 容 也 同样 适用 于 应 用 程序 。 

Java 最 早期 的 版 本 提供 了 一 种 比较 原始 的 方式 ， 来 支持 GUI 的 成 分 。 在 Java 的 1.2 版 本 中 ， 
加 入 了 一 组 新 的 GUI 成 分 ， 统 称 为 Swing。 


14.6.1 Java Swing 的 GUI 成 分 


在 javax.swing 中 定义 的 Swing 包 包括 了 一 组 成 分 。 由 于 我 们 在 这 里 的 兴趣 是 事件 处 理 ， 
而 不 是 GUI 的 成 分 ， 我 们 将 仅仅 讨论 两 种 widgets 一 一 文字 方 框 以 及 单 选 按 钮 。 

一 个 文字 方 框 是 JTextField 类 的 对 象 。 最 简单 的 JTextField 构 造 器 只 接受 一 个 参数 ， 
即 按 字 符 来 计算 的 方 框 长 度 。 例 如 : 


JTextField name = new JTextField(32); 


JTextField 构 造 器 也 可 以 接受 一 个 文字 串 作为 可 选 的 第 一 个 参数 。 如 果 存 在 这 个 文字 串 
参数 ， 它 将 显示 作为 文本 框 的 最 初 内 容 。 

单 选 按钮 是 放置 在 按钮 组 中 的 一 种 特殊 的 按钮 。 一 个 按钮 组 是 ButtonGroup 类 的 对 象 ， 
它 的 构造 器 不 接受 任何 参数 。 在 一 个 单 选 按钮 组 中 ， 一 次 只 能 按 一 个 按钮 。 如 果 任 何 一 个 按钮 
被 按 下 ， 先 前 按 下 的 按钮 就 被 隐 式 地 放 开 。JRadioButton 构 造 器 被 用 来 产生 单 选 按钮 ， 这 个 
构造 器 接受 两 个 参数 : 标号 以 及 按钮 的 初始 状态 (true 或 false， 按 下 或 未 按 下 )。 在 产生 一 
个 单 选 按钮 后 ， 使 用 按钮 组 对 象 的 add 方 法 ， 将 这 个 按钮 放 和 人 到 按钮 组 中 去 。 考 虑 下 面 的 例子 ; 

ButtonGroup payment = new ButtonGroup(); 

JRadioButton boxl = new JRadioButton("Visa", true); 

JRadioButton box2 = new JRadioButton("Master Charge", 

false); 
JRadioButton box3 = new JRadioButton("Discover", false); 
payment .add (box1); 


payment .add (box2); 
payment.add(box3); 


一 个 applet 的 显示 实际 上 是 一 个 多 层次 结构 的 框架 (FRAME)。 我 们 只 是 对 于 这 些 层次 之 一 
感 兴趣 ， 即 内 容 板 面 。 内 容 板 面 是 放置 applet 的 输出 的 地 方 。 用 户 程序 则 不 直接 将 任何 东西 放 
在 内 容 板 面 中 ， 相 反 ， 它 们 是 将 图 形 对 象 放 在 一 个 板 面 中 ， 然 后 再 将 这 个 板 面 加 入 到 内 容 板 面 
上 。 在 应 用 程序 的 情况 下 ， 则 是 先 产生 一 个 框架 ， 然 后 再 将 构造 出 的 板 面 加 入 到 这 个 框架 的 内 
容 板 面 上 。 

通过 使 用 getContentPane 方 法 将 一 个 内 容 板 面 创建 成 为 Container 类 的 对 象 ， 如 下 面 
的 语句 
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Container contentPane = getContentPane(); 


可 以 将 预定 义 的 图 形 对 象 ， 如 GUI 的 成 分 ， 直 接 加 入 到 applet 中 所 产生 的 板 面 上 ， 然 后 再 加 
入 到 applet 的 内 容 板 面 上 。 下 面 的 语句 产生 一 个 板 面 对 象 。 在 我 们 后 面 的 讨论 中 将 会 使 用 到 它 。 

JPanel myPanel = new JPanel(); 

在 使 用 构造 器 产生 了 GUI 成 分 后 ， 必 须 再 使 用 add 方 法 将 这 些 成 份 放 和 人 板 面 之 上 : 


myPanel.add(button1); 
14.6.2 Javaa! 


用 户 与 GUI 成 分 的 交互 产生 可 以 由 事件 处 理 器 来 捕捉 的 事件 。 事 件 处 理 器 提供 所 需要 的 计 
算 。 这 些 GUI 成 分 被 认为 是 事件 产生 器 。 它 们 都 产生 事件 。 在 Java 中 , 将 事件 处 理 器 称 为 事件 监 
听 器 (event listener) 。 事 件 监 听 器 通过 注册 事件 监听 器 与 事件 产生 器 相连 接 。 在 本 小 节 后 面 我 
们 将 会 谈 到 ， 一 个 实现 监听 器 接口 类 的 方法 ， 使 用 这 个 方法 来 完成 监听 器 的 注册 。 包 含 GUI 成 
分 的 板 面 对 象 ， 可 以 是 这 些 GUI 成 分 的 事件 监听 器 。 当 发 生 一 个 事件 时 , 仅仅 会 通知 那些 与 这 个 
事件 注册 了 的 事件 监听 器 。 

事件 产生 器 通过 传送 消息 给 事件 监听 器 (调用 监听 器 的 方法 ) 来 通知 事件 监听 器 所 发 生 的 
事件 。 接 收 消 息 的 监听 器 方法 将 实现 事件 处 理 器 。 使 用 一 个 接口 来 使 事件 处 理 器 方法 与 标准 协 
议 相 一 致 。 一 个 接口 体现 标准 的 方法 协议 ， 但 是 并 不 提供 这 些 方法 的 实现 。 强 迫 事件 产生 器 为 


JApplet 类 已 经 有 了 一 个 超 类 。 在 Java 中 ， 一 个 类 只 能 具有 一 个 父 类 。 因 此 ， 协 议 只 能 来 自 一 
个 接口 。 除 非 一 个 类 提供 它 所 实现 的 接口 中 的 所 有 方法 的 定义 ， 它 才能 被 范例 化 。 

一 个 需要 实现 监听 器 的 类 必须 实现 这 些 监听 器 的 接口 。 在 Java 中 有 许多 的 事件 类 和 监听 器 
接口 。 

一 个 事件 类 是 ItemEvent ， 它 与 选择 复 选 框 、 单 选 按钮 或 列表 项 的 事件 相关 联 。 
ItemListenez 接 口 指 定 了 itemStatechanged 方 法 ， 它 处 理 ItemEvent 事 件 。 因 此 ， 为 了 提供 
单 选 按钮 动作 触发 的 动作 ， 必 须 实现 的 接口 ItemListener 需 要 定义 方法 itemStateChanged， 

如 前 所 述 ，GUI 成 分 与 事件 监听 器 的 连接 ， 是 通过 一 个 实现 监听 器 接口 的 类 方法 来 完成 的 。 
例如 ， 因 为 ActionEvent 是 用 户 在 按钮 上 的 行动 所 产生 的 事件 对 象 的 类 名 ， 
addActionListener 方 法 就 被 用 来 将 一 个 监听 器 注册 到 按钮 上 。 可 以 在 一 个 面板 中 实现 在 
applet 的 面板 中 产生 的 按钮 事件 的 监听 器 。 因 此 如 果 面 板 Mypane1 实 现 ActionEvent 按 钮 事件 
处 理 左 ，button1 就 是 这 个 面板 中 的 按钮 。 我 们 可 以 用 下 面 的 语句 来 注册 监听 器 ， 

buttonl.addItemListener(this); 

每 一 个 事件 处 理 器 方法 接受 一 个 事件 参数 ， 这 个 参数 提供 关于 事件 的 信息 。 使 用 事件 类 的 
方法 ， 如 getState， 用 来 访问 这 条 信息 。 例 如 ， 当 通过 一 个 单 选 按钮 来 调用 getState 时 ， 
根据 按钮 是 开 或 关 的 状态 (FR PRAT), ，getState 将 返回 true 或 false。 

所 有 与 事件 有 关 的 类 都 被 包括 在 java .awt .event 包 中 。 所 以 ， 任 何 使 用 事件 的 applet 通 
前 都 会 输入 这 个 包 。 

下 面 是 一 个 名 称 为 RadioB 的 示例 applet。 我 们 用 它 来 说 明 如 何 使 用 事件 和 事件 处 理 器 来 显 
示 applet 中 的 动态 内 容 。 这 个 applet 生 成 一 些 单 选 按钮 来 控制 一 个 文字 域内 容 的 字体 。 对 于 四 种 
字体 中 的 每 一 种 ， 它 都 将 产生 一 个 Font 对 象 。 每 一 个 Font 对 象 都 具有 一 个 单 选 按钮 用 于 选择 
相关 的 字体 。 这 个 applet 然 后 会 产生 一 个 文字 串 。 用 户 将 使 用 按钮 来 控制 字体 。 这 里 的 事件 处 理 
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at ze itemStateChanged, 在 接 到 ItemEvent 对 象 的 关于 按钮 状态 变化 的 通知 以 后 ， 事件 处 
理 絮 将 确定 被 按 下 的 是 哪 一 个 按钮 ， 然 后 它 将 设 定 相 对 应 的 字体 。 


/* RadioB 的 示例 applet 如 何 使 用 事件 
和 事件 处 理 器 来 显示 applet 中 
的 动态 内 容 
*/ 
import java.awt.*; 
import java.awt.event.*; 
import java.applet.*; 
import javax.swing.*; 


public class RadioB extends JApplet implements 
ItemListener { 


// 将 大 多 数 变量 定义 为 类 变量 ， 
// 从 而 使 发 生 和 事件 处 理 器 对 其 可 见 


private Container contentPane = getContentPane(); 

private JTextField text; 

private Font plainFont, boldFont, italicFont, 
boldiItalicFont; 

private JRadioButton plain, bold, italic, bolditalic; 

private ButtonGroup radioButtons = new ButtonGroup(); 

private JPanel myPanel = new JPanel(); 


// 在 开始 处 构建 init 方 法 
public void init() { 
// 设置 面板 的 背景 色 
myPanel.setBackground(Color.cyan); 
// 创建 字体 


plainFont = new Font("Serif", Font.PLAIN, 16); 
boldFont = new Font("Serif", Font.BOLD, 16); 
italicFont = new Font("Serif", Font.ITALIC, 16); 
boldiItalicFont = new Font("Serif", Font.BOLD + 
Font.ITALIC, 16); 


// 创建 测试 文字 串 ， 设 置 其 字体 ， 
// 并 将 其 添加 到 面板 上 


text = new JTextField( 

"In what font style should I appear?", 30) 3 
myPanel.add(text); 
text.setFont(plainFont); 


// 创建 字体 单 选 按钮 并 
// 添加 到 面板 上 


plain = new JRadioButton("Plain", true); 

bold = new JRadioButton("Bold"); 

italic = new JRadioButton("Italic"); 
boldItalic = new JRadioButton("Bold Italic"): 
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radioButtons.add(plain); 
radioButtons.add(bold) ; 
radioButtons.add(italic); 
radioButtons.add(boldItalic) ; 


记录 事件 处 理 器 对 myPane1l 的 处 理 


plain.addItemListener(this) ; 
bold.addItemListener(this); 
italic.addItemListener(this) ; 
boldItalic.addItemListener(this) ; 


在 面板 上 添加 按钮 


myPanel.add(plain); 
myPanel.add(bold); 
myPanel.add(italic); 
myPanel.add(boldItalic); 


为 applet 添 加 面板 和 内 容 窗 格 
contentPane.add(myPanel); 
} // 结束 init() 
handler 事件 


public void itemStateChanged (ItemEvent e) { 


判定 当前 的 活动 按钮 并 
设置 其 字体 


if (plain.isSelected() ) 
text.setFont(plainFont) ; 

else if (bold.isSelected() ) 
text.setFont(boldFont); 

else if (italic.isSelected() ) 
text.setFont(italicFont) ; 


else if (boldItalic.isSelected() ) 
text.setFont(boldItalicFont) ; 


} // 结束 itemStateChanged 


} // 结束 RadioB applet 


图 14-2 是 RadioB applet 所 产生 的 屏幕 结果 显示 。 


n what font style should I appear? € Plain. « 


小 结 


日 20 世 纪 70 年 代 中 期 以 来 设计 的 许多 实验 性 语言 都 包含 了 异常 处 理 的 设施 ， 然 而 时 至 今日 已 经 有 好 





图 14-2 RadioB applet 的 输出 
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几 种 广泛 应 用 的 语言 包括 了 异常 处 理 。 

Ada 提 供 了 扩展 的 异常 处 理 设施 以 及 一 组 小 而 全 的 内 建 的 异常 。 异 常 处 理 程序 附 于 程序 实体 之 上 ， 虽 
然 在 没有 局 部 处 理 程 序 可 用 的 条 件 下 ,会 隐 式 或 显 式 地 将 异常 传播 给 其 他 的 程序 实体 。 

C++ 中 不 包括 预定 义 的 异常 (除了 定义 在 标准 程序 库 中 的 那些 异常 而 外 )。C++ 中 的 异常 为 原始 类 型 
的 对 象 、 预 定义 的 类 的 对 象 或 用 户 定义 的 类 的 对 象 。C++ 中 不 包括 内 建 的 异常 。 异 常 与 异常 处 理 程序 的 绑 
定 ， 是 通过 将 throw 语 句 中 表达 式 的 类 型 与 处 理 程 序 形 参 的 类 型 相连 接 。 所 有 的 处 理 程 序 都 有 着 相同 的 名 
字 ， 即 catch。 一 个 C++ 方 法 的 throw 子 句 列举 这 个 方法 所 抛 出 的 异常 的 类 型 。 

Java 中 的 异常 是 对 象 ， 它 的 祖先 必须 可 以 回 淹 到 Throwab1le 类 的 一 个 后 裔 类 。Java 具 有 两 个 类 型 的 异 
和 常 ， 即 要 检测 的 异常 与 不 检测 的 异常 。 要 检测 的 异常 是 用 户 程 序 及 编译 器 所 关心 的 异常 。 不 检测 的 异常 能 
够 发 生 在 任何 位 置 ， 并 且 常 常 被 用 户 程序 所 忽略 。 

Java 中 一 个 方法 的 throws 子 名 列举 它 所 抛 出 但 并 不 处 理 的 要 检测 的 异常 。throws 子 句 还 必须 包括 它 
所 调用 的 方法 可 能 提出 的 并 传播 回 它 的 调用 程序 的 异常 。 

Java 的 finally 子 句 提供 了 一 种 机 制 来 保证 一 些 代码 的 执行 ， 而 不 论 一 个 try 结 构 中 的 复合 语句 的 执 
行 是 怎样 结束 的 。 

Java 现 在 还 包括 了 assert 语 句 ， 用 以 进行 防 错 性 的 程序 设计 。 

一 个 事件 通知 某 一 件 需 要 处 理 的 事件 的 发 生 。 事 件 常 常 是 在 用 户 与 程序 交互 (通常 是 通过 图 形 用 户 接 
口 ) 时 所 产生 的 。Java 中 的 事件 处 理 器 被 称 为 监听 器 。 如 果 一 个 事件 发 生 时 需要 通知 它 的 监听 器 ， 就 必须 将 
这 个 监听 器 注册 到 这 个 事件 之 上 。Java 中 最 常用 的 监听 器 是 actionPerformed 和 ;itemStateCchanged， 这 
两 个 监听 絮 的 协议 由 相关 的 接口 来 提供 。 


文献 注释 


由 Goodenough 所 闭 的 (Goodenough，1975) 文献 是 讨论 异常 处 理 但 又 没有 局 限于 某 种 特定 语言 的 最 
好 的 论文 之 一 。MacLaren (1977) 描述 了 PL/I 中 的 异常 处 理 的 设计 问题 。Liskov 和 Snyder (1979) 清楚 地 
描述 了 CLU 的 异常 处 理 的 设计 。ARM (1995) 描述 了 Ada 语言 的 异常 处 理 设施 ，Romanovsky 和 Sander 对 
其 进行 了 批判 性 的 评价 。Stroustrup (1997) 描述 了 C++ 中 的 异常 处 理 。Campione et al. (2001) 描述 了 关 
于 Java 的 异常 处 理 。 


复习 题 


1. 定义 异常 、 异 常 处 理 程序 、 提 出 异常 、 禁 用 异常 、 继 续 以 及 内 建 异 常 。 

2. 异常 处 理 的 设计 问题 是 什么 ? 

3. 异常 与 异常 处 理 程序 相 绑 定 意味 着 什么 ? 

4. 在 Ada 中 的 异常 的 可 能 框架 是 什么 ? 

5. Ada 中 没有 被 处 理 的 异常 将 被 传播 到 哪里 ， 如 果 这 个 异常 是 在 一 个 子 程序 中 被 提出 的 ?是 在 一 个 块 中 
被 提出 的 ? 是 在 一 个 包 体 中 被 提出 的 ? 是 在 一 个 任务 中 被 提出 的 ? 

6. 在 Ada 中 ， 一 个 异常 被 处 理 之 后 ， 执 行将 从 何 处 继续 ? 

7. 在 Ada 中 ， 怎 样 显 式 地 提出 一 个 异常 ? 

8. 在 Ada 中 ， 任 何 来 定义 一 个 用 户 定义 的 异常 ? 

9. 在 Ada 中 ， 怎 样 禁用 一 个 异常 ? 

10. C++ 中 所 有 的 异常 处 理 器 的 名 称 是 什么 ? 

11. 在 C++ 中 ， 怎 样 显 式 地 提出 一 个 异常 ? 

12. 在 C++ 中 ， 怎 样 将 异常 与 异常 处 理 程序 相 绑 定 ? 

13. 在 C++ 中 ， 怎 样 编写 一 个 能 够 处 理 任何 异常 的 异常 处 理 程 序 ? 

14. 在 C++ 中 ， 当 一 个 异常 处 理 程序 的 执行 完成 后 ， 执 行 控制 将 被 转移 到 哪里 ? 
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15. C++ 包括 了 内 建 的 异常 吗 ? 

16. 所 有 Java 的 异常 类 的 根 类 是 什么 ? 

17. 在 Java 中 ， 大 多 数 的 用 户 定义 的 异常 类 的 父 类 是 什么 ? 

18. 如 何在 Java 中 编写 一 个 能 够 处 理 任何 异常 的 异常 处 理 程序 ? 
19. C++ 中 的 throw 说 明 与 Java 中 的 throws 子 句 之 间 有 什么 区 别 ? 
20. 在 Java 中 ， 要 检测 的 异常 与 不 检测 的 异常 之 间 有 什么 差别 ? 
21. 你 能 够 禁用 一 个 Java 中 的 异常 吗 ? 

22. Java 中 的 finally 子 句 的 目的 是 什么 ? 


练习 题 


1. 什么 是 运行 时 错误 或 状态 ?如 果 这 种 运行 时 错误 或 状态 存在 的 话 ，Pascal 程 序 能 够 检测 及 处 理 吗 ? 

2. 从 PLX 和 Ada 程 序 设计 的 教科 书 中 查找 关于 它们 的 内 建 异 常 的 相对 应 的 部 分 。 从 完整 性 与 灵活 性 的 两 个 
方面 ， 对 于 这 两 者 做 出 比较 性 的 评估 。 

3. 根 据 (ARM，1995) 来 确定 如 何 处 理 在 会 合 期 间 发 生 的 异常 。 

4. 根据 一 本 COBOL 的 教科 书 来 确定 ， 在 COBOL 程 序 中 怎样 进行 异常 处 理 。 

5. 在 不 具有 异常 处 理 设施 的 语言 中 ， 通 常 是 让 大 多 数 子 程序 包括 一 个 “出 错 ” 参 数 ， 以 这 个 参数 的 其 个 
值 来 表示 “OK”， 而 以 某 个 其 他 的 值 来 表示 “过 程 中 有 错 ”"。 相 对 于 这 种 方法 ， 一 种 语言 中 的 异常 处 理 
设施 ， 如 Ada 语 言 中 的 ， 具 有 什么 优越 性 ? 

6. 在 不 具有 异常 处 理 设施 的 语言 中 ， 我 们 可 以 将 一 个 错误 处 理 过 程 ， 作 为 参数 传送 给 每 一 个 可 能 检测 出 
需要 处 理 的 错误 的 过 程 。 这 种 方法 有 什么 缺点 ? 

7. 比较 在 练习 题 5 和 练习 题 6 中 所 提出 的 方法 ， 你 认为 哪 一 种 方法 更 好 ， 为 什么 ? 

8. 比较 C++ 中 的 和 Ada 中 的 异常 处 理 设施 。 依 你 之 见 ， 哪 一 种 设计 更 为 灵活 ? 哪 一 种 能 够 写 出 更 为 可 靠 的 
程序 ? 

9. 考虑 下 面 的 Java 程 序 框架 : 


class Big { 
int i; 
float f; 
void funl() throw int { 


try { 
throw i; 
throw f; 


} 
catch(float) { ... } 


} 
class Small { 
int j; 
float g; 
void fun2() throws float { 


try { 
try { 
Big.funl(); 
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throw j; 
throw g; 
} 
catch(int) { ... } 
} 
catch(float) { ... } 


} 

在 这 四 条 throw 语 句 中 的 每 一 条 ， 在 什么 位 置 处 理 异 常 ? 请 注意 ，fun1 被 类 Smal1 中 的 fun2 所 调用 。 
10. 写 出 C++ 和 Java 中 的 异常 处 理 功 能 的 详细 上 比较 报告 。 
11. 概述 有 利于 继续 的 终止 和 重新 开始 模型 的 参数 。 


程序 设计 练习 题 


1. 编写 一 段 Ada 代 码 ， 来 重新 尝试 对 于 过 程 Tape_Read 的 调用 ;过 程 Tape_Read 从 磁带 机 读 入 数据 ， 并 
且 可 以 提出 Tape Read Error 异 常 。 
2. 假 设 你 正在 编写 一 个 Ada 过 程 ， 存 在 着 三 种 不 同方 案 来 完成 这 个 过 程 的 要 求 。 编 写 出 这 个 过 程 的 一 个 
639 框 染 ， 使 得 当 第 一 种 方案 提出 任何 异常 时 ， 就 试行 第 二 个 方案 ,而 在 第 二 个 方案 提出 任何 异常 时 ， 就 
执行 第 三 个 方案 。 假 设 这 三 种 方案 已 经 分 别 被 命名 为 ALT1、ALT2 以 及 ALT3，。 
3. 编写 一 个 Ada 程 序 ， 从 键盘 输入 一 串 从 -100 到 100 的 整数 值 ， 并 且 计 算 所 输入 值 的 平方 和 。 这 个 程序 必 
须 使 用 异常 处 理 ， 从 而 确保 输入 值 是 在 范围 之 内 并 都 是 合法 的 整数 。 当 所 计算 的 平方 和 大 于 标准 的 
Integer 变 量 所 能 够 存储 的 值 时 ， 处 理 这 个 错误 ， 并 且 检 测 文件 结尾 的 状态 以 及 使 用 这 种 状态 来 产生 
结 来 输出 。 在 平方 和 溢出 的 情况 下 ， 显 示 出 错 信 息 并 终止 程序 。 
4. 为 练习 题 3 中 的 说 明 编 写 一 个 C++ 程序 。 
5. 为 练习 题 3 中 的 说 明 编写 一 个 Java 程 序 。 


第 15 章 ”函数 式 程序 设计 语言 


本 章 介绍 函数 式 程序 设计 以 及 一 些 为 用 函数 式 程序 设计 来 进行 软件 开发 而 设计 的 语言 。 因 
为 这 些 语 言 以 数学 函数 为 基础 ， 所 以 我 们 首先 复习 这 些 函数 的 基本 概念 。 接 着 ， 介 绍 函 数 式 程 
序 设计 语言 的 概念 以 及 第 一 种 函数 语言 LISP， 它 的 链表 数据 结构 和 基于 Lambda 标 记 的 函数 语 


法 。 接 下 来 的 较 长 的 一 节 用 来 介绍 Scheme， 包 括 它 的 一 些 原始 函数 、 特 殊 的 形式 、 函 数 的 形式 


和 用 Scheme 写 的 简单 函数 的 一 些 示 例 。 然 后 我 们 对 COMMON LISP, ML 和 Haskell 作 简单 介绍 。 
接 下 来 的 一 市 描述 函数 程序 设计 语言 的 一 些 应 用 。 最 后 ， 我 们 将 函数 式 语言 和 命令 式 语言 进行 
简短 比较 。 


15.1 概述 


本 书 的 前 14 章 主要 是 关于 命令 式 程序 设计 语言 和 面向 对 象 的 程序 设计 语言 的 。 除了 
Smalltalk 外 ， 我 们 所 讨论 的 面向 对 象 程序 设计 语言 都 类 似 于 命令 式 语言 。 

命令 式 语言 之 间 的 高 度 类 似 的 部 分 来 自 于 它们 共同 的 设计 基础 之 一 冯 - HERRA, 
如 同 我 们 曾经 在 第 1 章 中 讨论 的 。 我 们 可 以 整体 地 将 命令 式 语言 视 为 在 Fortran I 的 基本 模式 上 的 
改进 与 发 展 。 所 有 的 命令 式 语言 都 被 设计 来 高 效率 地 使 用 汉 - 诺 依 曼 体系 结构 的 计算 机 。 虽 然 
命令 式 风格 的 程序 设计 已 经 被 大 多 数 的 程序 人 员 所 接受 ， 但 许多 人 认为 它 对 于 汉 . ERRERA 
结构 的 高 度 依赖 性 ， 是 对 软件 开发 过 程 的 不 必要 的 限制 . 

除了 命令 式 的 以 外 ， 还 存在 其 他 的 语言 设计 的 基础 ， 其 中 的 一 些 更 着 眼 于 特殊 的 程序 设计 
范 型 或 者 是 方法 学 ， 而 不 古 在 某 一 种 特定 的 计算 机 体系 结构 上 的 高 效率 执行 。 然 而 迄今 为 止 ， 
只 有 很 少 一 部 分 的 程序 是 采用 非 命令 式 语 言 来 编写 的 。 

以 数学 函数 为 基础 的 函数 式 程序 设计 ， 是 最 重要 的 非 命 令 式 语言 风格 的 设计 基础 之 一 。 这 
种 风格 的 程序 设计 为 函数 式 程序 设计 语言 所 支持 。 

LISP 起 初 是 一 种 纯粹 的 函数 式 语 言 ， 但 很 快 就 获得 了 一 些 重要 的 命令 式 的 特性 ， 以 增进 它 
的 执行 效率 。 它 仍然 是 最 重要 的 函数 式 语言 ， 至 少 它 是 唯一 的 一 种 得 到 广 记 使 用 的 函数 式 语言 。 
Scheme 是 LISP 的 一 个 很 小 型 的 静态 作用 域 的 方言 。COMMON LISP 是 20 世 纪 80 年 代 初 期 的 几 种 
LISP 方 言 的 一 种 混合 产品 。ML 和 Haskell 是 强 类 型 的 函数 式 语言 ， 它 们 具有 比 LISP 和 Scheme 更 
加 传统 的 语法 。 

1977 年 的 图 灵 奖 颁发 给 了 John Backus， 以 奖励 他 在 Fortran 语 言 开发 中 的 贡献 。 每 一 个 获奖 
人 员 都 在 颁奖 仪式 上 进行 一 个 演讲 ， 这 篇 演讲 后 来 发 表 在 ACM 的 Communications 杂志 上 。 在 
他 的 演讲 中 ，Backus 认 为 函数 式 语言 比 命令 式 的 程序 设计 语言 更 好 原因 是 使 用 函数 式 语言 所 
编写 的 程序 可 读 性 更 好 也 更 可 靠 ， 并 且 正 确 性 可 能 也 更 好 ，。 他 的 论据 是 由 于 函数 式 程序 中 的 表 
达 式 以 及 函数 不 存在 副作用 ， 它 们 的 语义 也 与 上 下 文 无 关 。 因而 在 开发 中 以 及 开发 后 ， 纯 函数 
式 程序 更 容易 被 人 们 所 理解 。 

在 这 篇 演讲 中 ，Backus 提 出 了 一 种 纯 函 数 式 语言 FP (functional programming) ， 用 来 作为 讨 
论 他 的 论点 的 框架 。 后 来 ， 至 少 在 获得 广泛 使 用 这 一 点 上 ， 这 种 语言 没有 成 功 。 但 是 他 的 观点 
推动 了 对 于 函数 式 语言 的 讨论 和 研究 。 一 些 有 名 的 计算 机 科学 家 都 试图 推进 这 样 的 概念 ， 那 就 
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本 章 的 目的 之 一 是 通过 描述 Scheme 语言 中 的 核心 部 分 来 介绍 函数 式 程序 设计 。 虽 然 我 们 有 
意识 地 省 略 了 Scheme 语言 中 的 一 些 命令 式 的 特征 ， 但 我 们 仍然 有 充足 的 材料 使 读者 能 够 编写 出 
一 些 人 简单 而 又 有 趣 的 程序 。 缺 乏 实际 编程 经 验 的 人 会 感觉 到 自己 很 难 对 函数 式 程序 设计 有 彻底 
地 理解 ， 所 以 我 们 极力 建议 大 家 动 起 手 来 。 


15.2 数学 函数 


数学 函数 是 一 个 集合 中 的 成 员 到 另 一 个 集合 中 成 员 的 映射 ,前 一 个 集合 被 称 为 定义 域 集 
(domain set), 后 一 个 集合 被 称 为 值 域 集 (range set), 一 个 函数 定义 显 式 或 隐 式 地 说 明定 义 域 集 、 
值 域 集 和 映射 。 在 某 些 情况 下 ， 将 映射 描述 为 一 个 表达 式 或 一 个 表格 。 通 常 将 函数 作用 于 定义 
域 集 (作为 函数 的 参数 ) 中 的 特定 的 元 素 之 上 。 请 注意 ， 一 个 定义 域 集 可 能 是 多 个 集合 的 又 积 
( 它 反映 有 多 个 参数 ) 。 一 个 函数 产生 或 是 返回 一 个 值 域 集 中 的 元 素 . 

数学 函数 的 基本 特性 之 一 ， 是 由 递归 和 条 件 表 示 式 所 控制 的 、 它 们 的 映射 表达 式 的 求 值 次 
序 ， 而 不 是 命令 式 程序 设计 语言 中 常用 的 顺序 以 及 循环 的 重复 。 

因为 它们 没有 副作用 ， 所 以 数学 函数 另外 的 一 个 重要 的 特性 是 ， 当 给 定 一 组 相同 的 自 恋 量 
时 ， 它 们 总 是 定义 相同 的 值 。9 程 序 设 计 语 言 中 的 副作用 ， 与 模拟 存储 单元 的 变量 相关 联 。 

在 数学 上 没有 什么 东西 可 以 模拟 存储 单元 。 命 令 式 语言 函数 中 的 局 部 变量 保存 函数 的 状态 。 
在 数学 上 ， 没 有 函数 状态 这 一 概念 。 

一 个 数学 函数 定义 一 个 值 ， 而 不 是 说 明 从 内 存 中 的 值 生产 另 一 个 值 的 运算 序列 。 这 里 没有 
命令 式 语言 中 的 变量 ， 因 此 不 具有 任何 副作用 。 


15.2.1 简单 函数 


通 节 将 国 数 定义 写 为 一 个 函数 名 ， 后 面 跟随 圆 括号 中 的 一 串 参 数 ， 再 跟随 着 映射 表达 式 。 
例如 : 

cube(x) = x*x*x， 这 里 的 x 是 一 个 实数 

企 这 个 定义 中 ， 定 义 域 集 和 值 域 集 都 是 实数 。 符 号 三 意 为 “定义 为 "。 参 数 x 能 够 表示 定义 
域 集 中 的 任何 成 员 , 但 是 在 函数 表达 式 的 求 值 期 间 ， 则 表示 的 是 一 个 特定 的 元 素 。 这 是 数学 函 
数 的 参数 与 命令 式 语言 中 的 变量 之 间 的 不 同 。 

将 函数 的 应 用 说 明 为 一 个 函数 名 与 定义 域 集中 的 一 个 特定 的 元 素 的 对 。 将 定义 域 集 的 元 素 
代入 函数 映射 表达 式 的 参数 ， 来 进行 表达 式 的 求 值 ， 将 获得 值 域 集中 的 元 素 ， 举例 来 说 ，cube 
(2.0) 产生 值 8.0。 在 这 里 ， 一 个 值得 注意 的 重要 问题 是 ， 在 求 值 期 间 ， 一 个 函数 映射 所 包含 的 
参数 必须 是 绑 定 的 ， 一 个 绑 定 的 参数 是 一 个 特定 数值 的 名 字 。 Sr eer 
于 定义 域 集中 的 一 个 数值 之 上 ， 并 且 在 求 值 期 间 被 考虑 成 为 一 个 常量 ， 

早期 函数 的 理论 研究 将 定义 函数 与 给 函数 取 名 的 任务 区 别 开 来 。 i Coane Webs 
Lambda 标 记 (Church, 1941) 提供 了 一 种 定义 无 名 函数 的 方法 ， Lambda 表 达 式 说 明 一 个 函数 中 
的 参数 以 及 函数 的 映射 。Lambda 表 达 式 就 是 无 名 函数 的 本 身 ，。 例如 ， 考 虑 函数 . 
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如 前 所 述 ， 在 求 值 以 前 ， 一 个 参数 表示 定义 域 集 中 的 任何 成 员 ， 但 是 在 求 值 的 期 间 ， 它 将 


O 注意 ， 数 学 函数 定义 值 ， 而 程序 设计 语言 函数 产生 值 。 
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绑 定 于 一 个 特定 的 成 员 。 当 一 个 Lambda 表 达 式 对 一 个 给 定 的 参数 求 值 时 ， 我 们 就 称 之 为 : 表达 
式 被 应 用 到 那个 参数 之 上 。 这 种 应 用 机 制 对 于 任何 国 数 求 值 都 是 相同 的 。 在 下 面 的 例子 中 ， 
Lambda 表 达 式 的 应 用 ， 就 应 该 表示 为 : 

(K(x) xxx (2) 


所 产生 的 结果 是 数值 8。 
像 其 他 的 函数 定义 一 样 ，Lambda 表达 式 可 以 具有 多 个 参数 。 


15.2.2 函数 形式 

一 个 高 阶 函 数 (或 函数 形式 ) 是 一 个 可 以 取 函 数 为 参数 或 产生 一 个 函数 为 结果 或 者 两 者 党 
有 的 函数 。 一 种 常见 的 函数 形式 是 函数 复合 (function composition)， 它 有 两 个 函数 参数 ， 并 且 
产生 一 个 函数 ， 这 个 结果 函数 的 值 是 将 第 一 个 实 参 函 数 应 用 到 第 二 个 函数 的 结果 上 而 产生 的 。 
复合 函数 被 写成 一 个 表达 式 ， 使 用 ?来 作为 操作 符 ， 如 : 

Wang 

举例 来 说 ， 如 果 

fix) = x+2 

pa) = 3" x 

那么 h 就 被 定义 成 为 

h(x) = fg(x)) 或 者 h(x) = (3 * x) +2 

应 用 到 所 有 参数 (apply-to-all) 是 一 种 函数 形式 ， 它 取 一 个 函数 来 作为 参数 。 如 果 是 在 一 
组 日 变量 上 的 应 用 ,“ 应 用 到 所 有 参数 ”就 是 将 函数 参数 应 用 到 自 变 量 表 中 的 每 一 个 值 ， 而 且 将 
结 末 收 集 在 一 个 表 或 一 个 序列 中 。 符 号 a 被 用 来 表示 “应 用 到 所 有 参数 ”"。 考 虑 下 面 的 示例 : 

设 

h(x) =x*x 

那么 

oh, (2,3, 4)) 将 产生 (4,9, 16) 

还 有 许多 其 他 的 函数 形式 ， 但 以 上 两 例 说 明了 它们 的 特征 。 
15.3 函数 式 程序 设计 语言 的 基础 

函数 式 程 序 设计 语言 的 设计 目的 是 尽 可 能 最 好 地 模仿 数学 函数 。 这 个 目的 产生 了 一 种 根本 
不 同 于 命令 式 语 言 所 采用 的 解决 问题 的 方式 。 在 命令 式 语言 中 ， 对 于 一 个 表达 式 求 值 ， 然 后 将 
结 末 存储 在 一 个 存储 单元 中 ， 在 程序 中 ， 这 个 单元 被 表示 为 变量 。 对 存储 单元 需求 的 注意 ， 产 
生 了 一 种 相对 低层 次 的 程序 设计 方法 学 。 在 汇编 语言 的 程序 中 ， 就 经 常 必须 存储 表达 式 的 部 分 
求 值 的 结果 。 例 如 ， 计 算 表 达 式 

(x + y)/(a—b) | 

首先 计算 (x+y) 的 值 。 然 后 ， 当 计算 (a 一 b) 的 值 时 ， 必 须 将 前 面 的 值 存 储 起 来 。 在 高 
级 语言 中 ， 是 由 编译 器 来 处 理 表 达 式 求 值 中 间 结 果 的 存储 。 现 在 ， 仍 然 需要 存储 中 间 的 结果 ， 


但 是 将 细节 对 于 程序 人 员 隐 藏 了 起 来 。 
纯 函数 式 程序 设计 语言 不 使 用 变量 或 赋值 语句 。 这 使 得 程序 人 员 不 必 关 心 程序 所 运行 的 计 
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算 机 存储 单元 。 然 而 ， 如 果 没 有 变量 ， 循 环 结构 是 不 可 能 的 ， 因 为 循环 结构 是 通过 变量 控制 的 。 
因而 ， 不 使 用 循环 ， 就 必须 使 用 递归 来 实现 重复 。 一 个 程序 就 是 函数 定义 以 及 函数 应 用 的 说 
HY; 一 个 程序 的 执行 就 是 对 于 函数 应 用 的 求 值 。 如 果 没 有 变量 ， 纯 函数 式 语言 程序 的 执行 就 不 
存在 在 操作 语义 和 指称 语义 中 的 状态 。 当 给 予 同样 的 参数 的 时 候 ， 函 数 的 执行 总 是 会 产生 同样 
的 结果 。 这 种 特征 称 为 引用 透明 性 (referential transparency)。 这 种 特征 使 得 纯 函数 式 .语言 的 语 
义 比 命令 式 语言 的 语义 (包括 命令 式 特 性 的 函数 式 语 言 的 语义 ) ATS 

函数 式 语 言 提 供 一 组 原始 的 函数 ， 一 组 用 来 从 那些 原始 函数 构造 复杂 函数 的 函数 形式 ， 一 
种 函数 应 用 的 操作 ， 以 及 某 种 或 菜 些 表示 数据 的 结构 。 使 用 这 些 结构 来 表示 参数 以 及 函数 计算 
的 值 。 一 个 良好 定义 的 函数 式 语言 只 需要 很 少 的 原始 函数 。 

虽然 函数 式 语 言 经 党 是 使 用 解释 名 来 实现 ， 但 是 也 能 够 被 编译 。 

命令 式 语 言 通常 只 提供 对 于 函数 式 程序 设计 的 有 限 支 持 。 使 用 一 种 命令 式 语言 来 进行 函数 
式 程序 设计 的 最 严重 的 缺 挟 ， 是 在 命令 式 语言 中 对 于 冰 数 返回 值 类 型 上 的 限制 。 在 一 些 语言 ， 
如 Fortran 语 言 中 ， 仅 仅 能 够 返回 标量 类 型 的 数值 。 尤 其 重要 的 是 ， 命 令 式 语言 通常 不 能 够 返回 
一 个 函数 。 这 种 限制 局 限 了 所 能 够 提供 的 函数 形式 的 种 类 。 带 有 函数 的 命令 式 语言 的 另外 一 个 
严重 问题 是 具有 函数 副作用 的 可 能 性 正如 我 们 在 第 7 章 中 看 到 的 ， 函 数 式 副作用 降低 了 代码 可 读 
性 和 表达 式 的 可 靠 性 。 


15.4 第 一 种 函数 式 程序 设计 语言 : LISP 


人 们 已 经 开发 了 多 种 图 数 式 程序 设计 语言 ， 一 种 最 古老 并 且 最 为 广泛 使 用 的 语言 是 LISP。 
通过 LISP 语 言 来 学 习 函 数 式 语言 ， 类 似 于 通过 Fortran 语 言 来 学 习 命 令 式 语言 LISP 是 第 一 种 国 
数 式 语言 ， 但 是 一 些 人 现在 相信 ， 虽 然 它 在 过 去 40 年 来 不 断 发 展 ， 但 它 已 经 不 再 代表 函数 式 语 
言 的 最 新 的 设计 概念 。 此 外 ， 除 了 它 的 第 一 个 版 本 以 外 ， 所 有 的 LISP 方 言 都 包括 命令 式 语言 也 
特性 ， 例 如 命令 式 风格 的 变量 、 赋 值 语句 和 循环 (命令 式 风格 的 变量 被 用 来 命名 存储 单元 ， 能 
够 在 程序 执行 期 间 多 次 地 改变 这 些 变 量 的 值 )。 尽 管 有 着 一 些 奇 怪 的 形式 ，LISP 的 后 代 语 言 还 
是 很 好 地 表示 了 函数 式 程 序 设 计 的 基本 概念 ， 并 因此 而 具有 研究 价值 。 


15.4.1 数据 类 型 和 结构 


在 最 初 的 LISP 语 言 中 ， 仅 有 两 种 类 型 的 数据 对 象 ， 原 子 和 链表 。 。LISP 中 类 型 的 含义 与 命 
令 式 语言 中 类 型 的 含义 不 同 。 事 实 上 ， 最 初 的 LISP 是 一 个 无 类 型 的 语言 。 原 子 要 么 是 以 标识 名 
形式 存在 的 符号 ， 要么 是 数值 常量 。 

回忆 在 第 2 章 里 我 们 曾经 谈 到 ， 因 为 将 链表 认为 是 表 处 理 中 的 一 个 核心 部 分 ， 所 以 LISP 在 早 
期 使 用 链表 作为 它 的 数据 结构 。 然 而 最 终 发 展 的 结果 ，LISP 却 很 少 需要 插入 和 删除 的 链表 操作 。 

LISP 中 链表 的 说 明 是 通过 将 它们 的 元 素 放 在 圆 括号 内 。 简 单 链表 的 元 素 被 限制 为 原子 ， 如 

(A B C D) 

幅 套 的 链表 结构 也 使 用 圆 括 号 来 指定 。 如 链表 

(A (B C) D {E (FP G))) 
是 一 个 具有 四 个 元 素 的 链表 。 第 一 个 元 素 是 原子 A， 第 二 个 是 子 表 (B c); 第 三 个 是 原子 D A 
四 个 是 子 表 ( E (F G))， 而 它 的 第 二 个 元 素 是 子 表 (F G)。 





O 实际 上 ， 链 表 是 一 种 更 为 一 般 的 数据 结构 
在 15.5.8 市 中 给 予 些微 的 介绍 。 


尽 对 的 一 种 最 通用 的 形式 。 我 们 将 不 在 这 里 讨论 点 对 ， 只 是 将 


加 


在 内 部 ， 链 表 通 前 被 存储 为 单 向 链表 结构 ， 其 中 的 每 个 节点 表示 一 个 元 素 并 具有 两 个 指针 。 
原子 世上 所 的 第 一 个 指针 指 回 原子 的 某 一 种 表示 ， 例 如 ， 它 的 符号 或 数字 值 。 子 表 元 素 节 点 的 第 
一 个 指针 指向 子 表 的 第 一 节点 。 在 这 两 种 情况 下 ， 节 点 的 第 二 个 指针 都 指向 链表 的 下 一 个 元 素 。 
一 个 链表 通过 指向 它 第 一 个 元 素 的 指针 来 引用 。 

图 15-1 中 显示 了 我 们 两 个 示例 链表 的 内 部 表示 。 请 注意 ， 其 中 链表 的 元 素 被 水 平地 显示 。 





(A {B C) D (E (F G))) 


图 15-1 两 个 LISP 链表 的 内 部 表示 


> ie 
人 
~ 


15.4.2 第 一 个 LISP 解 释 器 


LISP 设 计 者 的 最 初 意图 是 使 LISP 的 程序 标记 法 尽 可 能 地 接近 Fortran 语 言 的 ， 在 必要 时 再 加 
入 一 些 部 分 。 这 种 标记 被 称 为 M 标 记 ， 意 为 元 标记 。 编 译 器 会 将 使 用 M 标 记 写 的 程序 翻译 为 语义 
上 相同 的 IBM 704 机 器 码 程 序 。 

在 LISP 发 展 的 早期 ,McCarthy 决 定 写 一 篇 文章 来 将 表 处 理 提升 为 一 种 一 般 符号 处 理 的 方式 。 
在 其 中 ，McCarthy 相 信 可 以 使 用 表 处 理 来 研究 可 计算 性 ， 当 时 通常 是 使 用 图 灵机 来 研究 可 计算 
性 。McCarthy 认 为 符号 表 的 处 理 是 比 图 灵机 更 自然 的 计算 模型 。 研 究 计算 中 的 通常 的 一 种 需求 ， 
是 必须 证 明 完整 类 计算 模型 的 可 计算 性 特征 ， 无 论 这 个 类 使 用 的 是 什么 计算 模型 。 在 图 灵机 模 
型 的 情况 下 ， 就 可 以 构造 一 个 模仿 任何 其 他 图 灵机 操作 的 通用 图 灵机 。 从 这 个 概念 我 们 得 到 了 
一 种 思想 ， 就 是 构造 一 个 通用 的 LISP 函 数 ， 来 对 LISP 中 的 任何 其 他 函数 求 值 。 

对 于 通用 LISP 函 数 的 第 一 个 要 求 ， 是 允许 使 用 和 表示 数据 同样 的 方式 来 表示 函数 的 一 种 标 
记 法 。 在 15.4.1 节 中 所 描述 的 加 括号 的 链表 标记 法 ， 当 时 就 已 经 被 采用 来 表示 LISP 中 的 数据 ， 
因此 人 们 决定 发 明 ， 能 够 表示 为 链表 的 函数 定义 ， 以 及 函数 调用 的 规则 。 可 以 将 函数 调用 说 明 [649 
为 ， 一 种 称 为 剑桥 波兰 表达 式 (Cambridge Polish) 的 前 缀 链表 形式 ， 如 ; 

(函数 名 参数 1，…， 参 数 n ) 
例如 ， 如 果 + 是 一 个 具有 两 个 数字 参数 的 函数 ， 


(+57) 
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计算 值 为 12。 
在 15.2.1 节 中 曾经 擅 述 的 Lambda 标 记号 被 选择 来 说 明 国 数 定 义 。 然 而 ,必须 将 它 进 行 修改 ， 
从 而 允许 名 字 与 国 数 的 绑 定 ， 以 便 国 数 能 被 其 他 的 国 数 或 目 身 所 引用 。 这 个 名 字 的 绑 定 由 一 
个 链表 来 说 明 ， 而 这 个 链表 则 由 一 个 函数 名 和 包含 Lambda 表 达 式 的 一 个 链表 所 组 成 ， 如 : 
(pa (LAMBDA (参数 1，…， 参 数 n) 表达 式 )) 


如 来 你 过 去 没有 接触 过 函数 式 程 序 设计 ， 也 许 会 对 一 个 无 名 函数 感到 很 奇怪 。 然 而 ， 在 函 
数 式 程序 设计 中 以 及 在 数学 上 ， 无 名 函数 有 时 也 会 有 用 。 例 如 ;考虑 一 个 函数 ， 它 的 行动 是 要 
产生 一 个 即刻 应 用 于 一 个 参数 链表 的 函数 。 这 个 将 被 产生 的 函数 就 没有 具有 名 字 的 必要 ， 因 为 
它 将 只 被 应 用 于 它 被 构造 的 位 置 。 在 15.5.10 节 中 将 给 出 这 样 的 一 个 示例 。 

采用 这 种 新 的 标记 说 明 的 LISP 函 数 ， 被 称 为 -表达 式 ， 也 即 符 号 表达 式 。 最 后 ， 将 所 有 的 
LISP 结 构 ， 数 据 和 代码 ， 都 称 为 5 一 表达 式 。 一 个 S 一 表达 式 ， 不 是 一 个 链表 就 是 一 个 原子 。 我 
们 通 妆 会 尚 单 地 称 S- 表 达 式 为 表达 式 。 

McCarthy 成 功 地 开发 了 一 个 可 以 计算 任何 其 他 函数 的 通用 函数 。 这 个 函数 被 命名 为 EVAL， 
并 且 它 本 身 就 被 表示 为 一 种 表达 式 的 形式 。 人 工 智能 项 目 中 的 两 个 人 物 Stephen B. Russell 和 
Daniel J. Edwards， 注 意 到 可 以 将 EVRL 的 实现 用 作 LISP 解 释 器 ， 他 们 立即 就 创建 了 这 样 的 一 种 
实现 (McCarthy et al.，1965 ) 。 

这 个 很 快速 的 、 容 易 的 、 料 想不到 的 实现 有 着 一 些 重要 的 结果 。 首 先 ， 所 有 早期 的 LISP 系 
统 都 复制 了 EVAL， 因 此 这 些 系统 都 是 解释 性 的 。 其 次 ， 原 来 计划 将 M 一 标记 的 定义 用 作 LISP 程 
序 设计 的 标记 ， 然 而 却 从 未 被 完成 或 实现 ， 因 此 S- 表 达 式 就 成 为 了 LISP 中 的 唯一 标记 。 使 用 相 
同 的 标记 来 表示 数据 和 代码 有 重要 的 结果 ， 其 中 之 一 ， 我 们 将 在 15.5.12 小 节 中 进行 讨论 。 第 三 ， 
最 和 初 语言 设计 中 的 很 多 东西 实际 上 被 冻结 了 起 来 ， 然 而 却 将 一 些 奇 怪 的 特性 留 在 了 语言 之 中 ， 
例如 ， 条 件 表示 式 的 形式 和 使 用 一 对 空 括号 ( ) 来 表示 空 链表 和 逻辑 的 假 。 

早期 LISP 系 统 的 另外 一 个 显然 是 意外 的 特性 就 是 动态 作用 域 的 使 用 。 函 数 在 它们 的 调用 者 
的 环境 中 被 求 值 。 在 那 时 ， 没 有 什么 人 知道 有 关 作 用 域 的 事 ， 而 且 对 于 做 出 的 选择 也 没有 过 多 
的 考虑 。 在 1975 年 以 前 LISP 中 的 大 多 数 方言 都 使 用 动态 作用 域 。 而 当代 的 方言 或 者 使 用 静态 作 
用 域 ， 或 者 允许 程序 人 员 在 静态 作用 域 和 动态 作用 域 之 间 进 行 选择 。 


15.5 Scheme 概 述 


在 这 一 市 中 ， 我 们 将 描述 Scheme 的 一 部 分 (Dybvig，2003)。 我 们 选择 Scheme 是 因为 它 相 
对 人 简单， 并且 流行 于 学 院 和 大 学 中 ， 另 外 Scheme 的 解释 器 对 于 许多 计算 机 都 是 现成 可 得 的 。 在 
这 一 市 中 所 描述 的 版 本 是 Scheme 4。 请 注意 ， 本 节 仅 仅 介绍 Scheme 中 很 小 的 一 个 部 分 ， 而 且 我 
们 将 不 介绍 Scheme 的 命令 式 特征 。 


15.5.1 Scheme 的 起 源 


Scheme 语言 是 LISP 的 一 支 , 于 20 世 纪 70 年 代 的 中 期 起 源 于 MIT (Sussman and Steele, 1975), 
它 的 特点 是 规模 小 、 仅 使 用 静态 作用 域 和 它 是 将 函数 作为 第 一 类 实体 来 对 待 。 作 为 第 一 类 实体 ， 
Scheme 中 的 函数 可 能 是 表达 式 的 值 ， 以 及 链表 中 的 元 素 ， 而 且 能 够 将 它们 赋 给 变量 ， 以 及 它们 
可 以 被 作为 参数 传递 。LISP 的 早期 版 本 不 提供 所 有 的 这 些 功能 

作为 一 种 具有 简单 语法 和 语义 的 小 型 语言 ， Schere PHEA 于 教育 应 用 ， 例如， 函数 式 程 

序 设计 课程 以 及 程序 设计 概论 课程 。 
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注意 ， 在 下 面 一 市 中 的 大 部 分 Scheme 函 数 只 需要 稍 作 修 改 ， 就 能 够 成 为 LISP 函 数 。 
15.5.2 Scheme 解释 器 


Scheme 解释 器 是 一 种 “ 读 - 计 算 - 写 ”的 无 限 循环 。 它 重复 地 读 用 户 键入 的 表达 式 (以 链 
表 的 形式 )， 解 释 这 个 表达 式 ， 然 后 显示 所 产生 的 值 。 表 达 式 由 函数 EVAL 来 解释 。 文 字 常 数 的 
结 采 就 是 它们 的 自身 。 因 此， 如 果 你 给 解释 器 键入 一 个 数字 ， 它 就 仅仅 是 显示 这 个 数字 。 调 用 
原始 函数 的 表达 式 是 以 下 面 的 方式 来 进行 求 值 的 : 首先 ， 对 于 每 一 个 参数 表达 式 求 值 ， 并 且 无 
所 谓 次 序 。 然 后 将 原始 函数 应 用 到 参数 值 ， 而 且 将 所 产生 的 值 显示 出 来 。 


15.5.3 原始 数值 函数 


在 本 小 节 中 ， 将 讨论 仅仅 处 理 数值 原子 而 不 处 理 符号 原子 和 链表 的 Scheme 原始 函数 。 

Scheme 包括 基本 算术 运算 的 原始 函数 。 它 们 是 +、- 、* 和 /， 即 加 法 、 减 法 、 乘 法 和 除法 。 
* 和 + 运算 能 够 具有 零 个 或 多 个 参数 。 如 果 * 运 算 没 有 参数 ， 它 将 返回 1， 如 果 + 运 算 没有 参数 ， 
它 将 返回 0。+ 运 算 将 它 的 全 部 参数 相 加 起 来 ，* 运 算 则 将 它 的 所 有 的 参数 相 乘 。/ 和 一 运算 能 
具有 两 个 或 更 多 的 参数 。 在 减法 的 情况 下 ， 除 了 第 一 个 参数 外 的 所 有 的 参数 ， 都 被 从 第 一 个 参 
数 中 减 去 。 除 法 与 减法 类 似 。 示 例如 下 : 


表达 式 值 
42 42 
人 21 
(+ 5 7 8) 20 
(一 5 6) 
(一 15 7 2) 6 
(一 24 (* 4 3) ) 12 
如 采 参 数值 不 为 负 ，SQORT 将 返回 它 的 数值 参数 的 平方 根 。 
15.5.4 定义 函数 


Scheme 程序 是 一 个 函数 定义 的 集合 ， 因 而 定义 函数 是 编写 哪怕 是 最 简单 的 程序 的 先决 条 件 。 
回忆 在 15.2.1 小 节 中 曾经 提 到 的 ，Scheme 函 数 形式 基于 的 是 Lambda 标 记 法 。 在 Scheme 中 的 一 个 
无 名 函数 实际 上 包括 了 LAMBDA 这 个 字 ， 并 被 称 为 lambda 表 达 式 (Lambda expression), 。 例 如 ， 


(LAMBDA (x) (* x x)) 


不 一 个 无 名 函数 ， 它 将 返回 所 给 定数 值 参 数 的 平方 值 。 可 以 像 命 名 函数 一 样 来 应 用 这 个 拖 
数 : 即 ， 将 它 放 置 在 包含 实 参 的 链表 的 前 面 。 例 如 ， 我 们 可 以 有 : 


((LAMBDA (x) (* x x)) 7) 


它 将 得 到 值 49。 在 这 里 ，x 被 称 为 Lambda 表 达 式 中 的 绑 定 变量 。 当 lambda 表 达 式 开始 求 值 时 ， 
如 朱 将 一 个 变量 绑 定 到 一 个 实 参 数值 ， 之 后 这 个 绑 定 变量 就 不 会 在 表达 式 中 被 改变 - 

特殊 形式 的 Scheme 函数 DEFINE 服 务 于 Scheme 程序 设计 的 两 个 基本 需求 将 一 个 名 字 绑 定 到 
一 个 值 上 ， 以 及 将 一 个 名 字 绑 定 到 一 个 lambda 表 达 式 上 。 第 一 种 使 用 可 能 听 起 来 像 是 能 够 使 用 
DEFINE 来 产生 命令 式 风格 的 变量 。 然 而 ， 这 些 名 字 绑 定 所 产生 的 是 命名 常量 而 不 是 变量 。 

我 们 将 DEFINE 称 为 是 一 种 特殊 的 形式 ， 因 为 与 算术 函数 等 通常 的 原始 函数 相 比较 ， Exe 
通过 EVAL 的 一 种 不 同 的 方式 来 被 解释 的 ， 我 们 将 很 快 就 能 够 了 解 到 这 一 点 。 
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DEFINE 的 一 种 最 简单 的 形式 ， 是 用 来 将 一 个 符号 绑 定 到 一 个 表达 式 的 值 上 。 这 种 形式 为 
(DEFINE 符号 表达 式 ) 
例如 ， 
(DEFINE pi 3.14159) 
(DEFINE two _pi (* 2° piy) 
如 果 已 经 将 这 两 个 表达 式 键入 给 Scheme 解释 器 ， 然 后 再 键入 Pi 时 ， 就 将 显示 值 3.14159， 
当 键入 two_pi 时 ， 将 显示 值 6.28318。 实 际 上 ， 计 算 机 显示 的 值 比 真正 的 数值 位 数 少 。 
Scheme 中 的 名 字 由 字母 、 数 字 和 除 括号 之 外 的 特殊 字符 组 成 ， 它 们 是 大 小 写 敏感 的 ， 并 且 
不 能 以 数字 打头 。 
DEFINE 国 数 也 用 于 将 一 个 lambda 表 达 式 绑 定 到 一 个 名 字 之 上 。 在 这 种 情况 下 ，lambda 表 达 
式 被 缩写 ， 以 便 省 略 lambda 一 字 。 通 过 这 种 形式 ，DEFINE 将 接受 两 个 链表 作为 参数 。 第 一 个 
参数 就 是 函数 调用 的 原型 ， 这 是 一 个 链表 ， 其 中 函数 名 的 后 面 跟随 着 形 参 。 第 二 个 链表 包含 名 
字 将 要 绑 定 的 表达 式 。 这 样 形式 的 DEFINE 一 般 为 :9 
(DEFINE (iz 参数 ) 
(KIEA) 
) 
下 面 的 示例 中 对 DEFINE 的 调用 是 将 名 字 square 与 跟随 它 的 表达 式 相 绑 定 ， 带 有 一 个 
数 : 
(DEFINE (square number) (* number number) ) 
在 解释 器 计算 了 这 个 国 数 后 ， 它 就 能 够 使 用 ， 例 如 
(square 5) 
将 显示 值 25。 
下 面 将 举例 说 明 原 始 函数 与 DEFINE 特 殊 形式 之 间 的 区 别 ， 考 虑 
(DEFINE x 10) 
如 果 DEFINE 是 一 个 原始 函数 ，EVAL 在 这 个 表达 式 上 的 第 一 个 行动 ， 将 是 对 DEFINE 的 两 
个 参数 求 值 。 如 果 还 没有 将 x 绑 定 到 一 个 值 之 上 ， 这 将 会 是 一 个 错误 。 此 外 ， 如 果 已 经 定义 了 x， 
这 也 将 是 一 个 错误 ， 原 因 是 DEFINE 将 会 试图 重新 来 定义 x， 而 这 是 非法 的 。 
下 面 是 另外 一 个 简单 函数 的 例子 。 这 个 函数 将 计算 ， 在 给 定 两 条 边 的 长 度 时 ， 直 角 三 角形 
的 斜 边 的 长 度 。 
(DEFINE (hypotenuse sidel side2) 


(SQRT(+(Square sidel)(square side2) ) ) 
) 


注意 ， 这 个 hypotenuse 畏 数 使 用 了 前 面 所 定义 的 square 图 数 。 
15.5.5 输出 函数 


Scheme 包括 一 些 简单 的 输出 函数 ， 例 如 ; 
(DISPLAY 表达 式 ) 
和 


O 实际 上 ，DFFINE 的 一 般 形 式 有 一 个 包含 一 个 或 多 个 表达 式 的 列表 ， 尽 管 在 大 多 数 情 况 下 只 包含 一 个 。 出 于 
简单 的 缘故 ， 这 里 只 包含 了 一 个 表达 式 。 


由 


(NEWLINE) 
它们 的 语义 是 明显 的 。 然 而 ， 大 多 数 Scheme 程 序 的 输出 ， 即 是 解释 器 的 正常 输出 , 所 显示 
的 是 将 EVAL 应 用 于 高 层 冰 数 的 结果 。 


15.5.6 数值 谓词 函数 


谓词 函数 返回 一 个 布尔 值 (或 者 是 真 ， 或 者 是 假 )。Scheme 包括 一 组 用 于 数值 数据 的 谓词 
函数 。 这 些 函 数 中 的 一 部 分 为 ; 


= 等 于 

<> 不 等 于 

> KF 

< 小 于 

>= 大 于 或 者 等 于 
<= 小 于 或 者 等 于 
EVEN? 是 一 个 偶数 吗 ? 
ODD? 是 一 个 奇数 吗 ? 
ZERO? 是 零 吗 ? 


注意 ， 所 有 预定 义 的 谓词 函数 的 名 字 都 是 以 问号 来 结束 的 。 在 Scheme 中 的 两 个 布尔 值 是 
#T 和 #F。Scheme 中 预定 义 的 谓词 函数 返回 空 链表 ( ) ， 而 不 是 #F ， 虽 然 这 二 者 是 等 价 的 。 谓 词 
函数 返回 的 任何 非 空 链 表 都 被 解释 为 #T。 从 可 读 性 方面 来 考虑 ， 本 章 中 所 有 谓词 函数 的 例子 都 
将 返回 #F， 而 不 是 ( )。 


15.5.7 控制 流程 


Scheme 使 用 3 种 不 同 的 控制 流 结构 ， 一 种 是 基于 命令 式 语 言 的 选择 结构 的 模型 ， 其 他 两 种 
是 基于 在 数学 函数 中 使 用 的 求 值 控 制 。 

Scheme 中 有 两 种 控制 结构 ， 一 种 是 双向 选择 ， 另 一 种 则 是 多 向 选择 。 这 两 者 都 是 特殊 形式 。 
双生 选择 器 称 为 IF， 它 具有 三 个 参数 : 一 个 谓词 表达 式 、 一 个 then_ 表 达 式 以 及 一 个 else_ 表 达 
式 。 对 于 IF 的 调用 的 形式 为 : 


(IF 谓 词 then_ 表 达 式 else 表达 式 ) 


例如 ， 
(DEFINE (factorial n) 
(IF (=n 0) 
1 
(* n (factorial (- n 1))) 


)) 

请 注意 ， 这 个 函数 的 形式 和 上 面 所 给 的 阶乘 的 数学 定义 是 紧密 相关 的 。 

数学 函数 定义 中 的 控制 流程 ， 与 命令 式 程序 设计 语言 程序 中 的 控制 流程 相当 不 同 。 命 令 式 
语言 中 的 沙 数 被 定义 为 一 种 可 能 包括 几 种 类 型 的 顺序 控制 流程 的 语句 集合 ， 然 而 数学 函数 不 具 
有 多 重 语句 ， 并 且 只 使 用 递归 和 条 件 表达 式 来 说 明 计 算 流程 。 例 如 可 以 使 用 两 个 操作 ， 将 阶乘 
国 数 定 义 为 : 
l “4 n=0 


TOT NR 当 n>0 


CN 


CN 


440 RISE 





数学 条 件 表达 式 的 形式 是 采用 一 连 串 的 对 ， 其 中 每 个 对 都 是 一 个 被 守护 的 表达 式 。 每 个 被 
守护 的 表达 式 由 一 个 守护 谓词 和 一 个 表达 式 所 组 成 。 这 样 的 一 个 条 件 表达 式 的 值 就 是 与 为 真 的 
谓词 相关 的 表达 式 的 值 。 对 于 给 定 的 参数 或 参数 链表 ， 只 有 其 中 的 一 个 谓词 为 真 。 

基于 数学 条 件 表达 式 的 Scheme 多 向 选择 器 的 特殊 形式 称 为 COND .COND 是 一 个 数学 条 件 表 
示 式 的 稍微 一 般 化 的 版 本 ， 它 人 允许 多 个 谓词 同时 为 真 。 因为 不 同 的 数学 条 件 表达 式 具 有 不 同 数 
目的 参数 ，COND 不 需要 有 固定 数目 的 实 参 。COND 的 每 一 个 参数 都 是 一 对 表达 式 ， 其 中 的 第 一 
个 参数 是 一 个 谓词 。 

COND 的 一 般 形 式 是 : 

(COND 

(谓词 _1 表达 式 ) 
(谓词 _2 表达 式 ) 
(谓词 _n 表达 式 ) 
(ELSE 表达 式 ) 

) 

在 一 些 实 现 中 ，ELSE 是 可 省 略 的 。 

COND 的 语义 是 .对 于 参数 的 谓词 的 求 值 ， 一 次 一 个 ， 从 第 一 个 开始 依照 顺序 ， 直 到 其 中 一 
个 的 值 为 #T。 然 后 对 于 在 第 一 个 为 #T 的 谓词 后 面 的 表达 式 进 行 求 值 ， 将 值 返 回 作为 COND 的 值 。 
如 末 没 有 谓词 为 真 却 有 一 个 ELSE 子 句 ， 那 么 求 值 表达 式 并 返回 结果 值 。 如 来 没有 谓词 为 真 也 没 
有 ELSE 子 句 ， 那 么 COND 值 是 未 指定 的 。 因 此 所 有 coND 都 应 该 包含 一 个 ELSE 子 句 ， 

请 注意 ， 在 一 个 COND 与 一 个 在 末尾 具有 一 条 “otherwise” 子 句 的 多 向 选择 语句 ， 如 Ada 中 
的 case 语 句 ， 之 间 的 相似 性 。 

下 和 面 ， 是 使 用 COND 的 一 个 简单 函数 的 例子 。 

(DEFINE. (比较 x y) 

(COND 
((> xy) “x K Fy” ) 
CS ey) Ky RTE) 
(ELSE LE SETY.) 

) 

在 下 面 的 章节 里 ， 我 们 还 有 更 多 关于 使 用 COND 的 例子 。 

第 三 种 Scheme 控制 机 制 是 递归 ， 它 在 数学 中 使 用 ， 用 于 控制 重复 操作 。 第 15.5.10 节 中 的 大 
部 分 函数 例子 都 使 用 递归 。 


15.5.8 链表 函数 


基于 LISP 的 语言 的 、 实 际 上 即 函 数 式 语言 的 最 通常 的 应 用 ， 是 用 于 链表 的 处 理 ， 本 小 节 将 
介绍 Scheme 中 的 链表 处 理 函 数 。 

我 们 首先 描述 的 Scheme 原始 函数 ， 即 是 工具 函数 EVRAL， 它 是 Scheme 国 数 应 用 操作 的 性 质 
所 需要 的 函数 。EVAL 是 Scheme 中 所 有 函数 求 值 的 基础 ， 不 论 是 原始 函数 还 是 其 他 函数 的 求 值 ， 
都 调用 它 来 处 理 Scheme 解 释 器 中 “ 读 一 计算 一 写 ” 行 动 的 求 值 部 分 。 当 应 用 于 一 个 原始 函数 之 
上 时 ，EVAL 首 先 将 对 于 给 定 的 函数 的 参数 求 值 。 当 一 个 函数 调用 中 的 实 参 的 本 身 就 是 函数 调用 
时 (通常 就 是 这 种 情况 )， 这 个 行动 是 必需 的 。 然 而 在 一 些 函 数 调用 中 ， 参数 是 数据 元 素 ， 它 可 
能 是 原子 也 可 能 是 链表 ， 而 并 非 函数 引用 。 当 一 个 参数 不 是 函数 引用 时 ， 显然 就 不 应 该 对 它 进 
行 计算 。 我 们 在 前 面 没有 涉及 这 一 点 ， 因 为 不 能 够 错误 地 将 文字 常数 用 作 函 数 名 。 
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假设 我 们 有 一 个 函数 ， 它 具有 两 个 参数 ， 一 个 是 原子 ， 另 外 一 个 是 链表 ， 函 数 的 目的 是 决 
定 是 否 所 给 定 的 原子 是 在 给 定 的 链表 中 。 原 子 和 链表 都 是 文字 常数 数据 ， 二 者 都 不 应 该 被 计算 。 
为 了 避免 计算 一 个 参数 ， 首 先 将 它 作 为 一 个 原始 函数 QUOTE 的 参数 来 给 出 ， QUOTE BH EIR 
回 ， 而 不 会 进行 任何 改变 。 下 面 的 示例 说 明 QUoTE 函数 ， 

(QUOTE A) 返回 A 

(QUOTE (A B C)) 返回 (A B C) 

在 本 章 的 余下 部 分 ， 我 们 将 会 使 用 一 种 常用 的 缩写 来 表示 对 QUomE 的 调用 ， 即 在 被 引述 的 
表达 式 前 面 放置 单 引号 (')。 因 此 ， 我 们 将 会 使 用 '(A B) 来 替代 (QUOTE(A B)), 

用 于 链表 处 理 的 语言 必须 包括 有 操纵 链表 的 原始 函数 。 尤 其 是 ， 它 必 须 能 够 提供 一 些 操作 
用 于 选择 链表 中 的 一 部 分 ， 这 在 某 种 意义 上 即 是 拆散 链表 ， 以 及 至 少 具有 一 种 操作 来 构造 链表 。 
在 Scheme 中 有 两 个 原始 链表 选择 器 : CAR 和 CDR (发 音 是 “could-er”) 。CAR 函 数 将 返回 给 定 的 
链表 中 的 第 一 个 元 素 。 下 面 的 示例 用 来 说 明 cAR 函 数 . 

(CAR ‘(A B C)) 返回 A 

(CAR '((A B) C D) 返回 (A B) 

(CAR 'A) 是 错误 的 ,因为 A 不 是 一 个 链表 

(CAR '(A)) 返回 A 

(CAR '()) 是 错误 的 

CDR 函 数 返 回 给 定 的 链表 中 CAR 部 分 被 移 走 之 后 的 剩余 部 分 . 

(CDR '(A B C)) 返回 (B C) 

(CDR '((A B) C D)) 返回 (C D) 

(CDR 'A) 是 错误 的 

(CDR ‘(A)) 返回 () 

(CDR '()) 是 错误 的 

下 面 是 CAR 和 CDR 函 数 名 字 的 由 来 。 这 些 名 字 起 源 于 LISP 在 IBM 704 计 算 机 上 的 第 一 种 实现 
704 机 器 的 内 存 字 具有 两 个 域 ， 分 别 被 命名 为 减 量 (decrement) 和 地 址 (address) ， 用 于 各 种 不 
同 的 操作 数 寻 址 。 每 一 个 域 都 可 以 存储 一 个 机 器 存储 器 的 地 址 。 704 机 絮 还 包括 两 条 机 器 指令 ， 
分 别 被 命名 为 CAR (contents of address register) 和 CDR (contents of decrement register)， 用 于 提 
取 相 关 的 域 。 十 分 自然 地 ， 可 以 使 用 内 存 字 的 这 两 个 域 来 存储 链表 节点 上 的 两 个 指针 ， 以 便 一 
个 内 存 字 可 以 完整 地 存储 一 个 节点 。 使 用 这 些 方法 ， 704 机 器 中 的 CAR 和 CDR 指 令 提 供 了 高 效率 
的 链表 选择 器 。 它 们 的 名 字 也 就 被 用 于 LISP 的 所 有 方言 中 ， 来 作为 两 个 原始 函数 的 名 称 。 

下 面 是 一 个 简单 的 函数 示例 : 

(DEFINE (second lst) (CAR (CDR 1st)})) 

一 县 对 这 个 函数 求 值 ， 它 就 可 以 被 使 用 ， 如 : 

(second '(A B C)) 

该 语句 返回 B。 

CONS 古 一 种 原始 链表 构造 器 。 它 以 它 的 两 个 参数 来 建立 一 个 链表 ， 第 一 个 参数 或 者 是 一 个 
原子 或 者 是 一 个 链表 ， 第 二 个 参数 通常 是 一 个 链表 CONS 将 它 的 第 一 参数 插入 ， 以 作为 它 的 第 
二 个 参数 的 新 的 CAR。 考 虑 下 面 的 示例 ; 


(CONS ‘A '()) 返回 (A) 

(CONS 'A '(B C)) 返回 (A BC) 

(CONS '() '(A B)) 返回 (() A B) 
(CONS ‘(A B) '(D C)) 返回 ((A B) C D) 


这 些 CONS 操 作 的 结果 显示 在 图 15-2 中 。 请 注意 ， 在 某 种 意义 上 CONS 是 CAR 和 CDR 的 逆 。 
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CAR 和 CDR 把 一 个 链表 拆 开 ， 然 而 CONS 使 用 给 定 的 链表 部 分 来 构造 一 个 新 的 链表 。CONS 的 两 个 
参数 成 为 新 的 链表 的 CAR 和 CDR。 因 此 ， 如 果 1lis 是 一 个 链表 ， 那 么 


(CONS (CAR lis) (CDR lis)) 
将 返回 一 个 与 1is 完 全 相同 的 链表 。 
由 于 在 本 章 中 讨论 的 都 是 相对 简单 的 问题 和 程序 ， 读 者 也 许 觉 得 没有 必要 将 CONS 用 于 两 个 


(CONS ‘A ‘B) 
sam aos 


(A) A 
(CONS 'A '(B C)) ele 
(A B C) A B c 


(CONS '() ‘(A B)) | g| @ 


(()A B) 










15-2 几 种 CONS 操 作 的 结果 


原子 。 然 而 这 是 合法 的 ， 并 且 常 常会 意外 地 发 生 。 将 CONS 用 于 两 个 原子 的 结果 是 一 个 点 对 。 这 
个 名 字 来 自 于 Scheme 中 显示 结果 的 方式 。 例 如 ， 考 虑 下 面 的 调用 : 

显示 其 结果 是 : 

(A . B) 

这 个 带 氮 的 对 表示 这 个 单元 具有 两 个 原子 ， 而 不 是 一 个 原子 和 一 个 指针 ， 也 不 是 两 个 指针 。 

LIST 是 一 个 函数 ， 它 从 可 变数 目的 参数 来 构造 一 个 链表 。 它 是 嵌 套 的 CoNS 的 一 个 速记 版 
本 。 例 如 : 


(LIST 'apple' ‘orange' 'grape') 返回 (apple orange grape) 
15.5.9 处 理 符号 原子 和 链表 的 谓词 函数 


Scheme 具有 三 种 用 来 处 理 符号 原子 和 链表 的 重要 的 谓词 函数 ， 即 Bo?、NULL? 和 LIST? 
EQ? 图 数 带 有 两 个 符号 参数 。 如 果 这 两 个 参数 都 是 原子 ， 并 且 这 两 个 参数 相等 ， 它 将 返回 
#T; 否则 ， 它 将 返回 #F。 考 虑 下 面 的 示例 : 


(EQ? 'A 'A) 返回 #T 
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(EQ? 'A 'B) 返回 #F 

(EQ? 'A '(A B)) 返回 #F 

(EQ? '(A B) '(A B)) 返回 #F， 或 者 是 返回 #T 

如 最 后 的 这 一 种 情形 所 显示 的 ， 使 用 EQ? 来 比较 链表 的 结果 取决 于 实现 ， 一 些 实现 将 产生 
#T， 而 另外 的 一 些 则 产生 #F。 之 所 以 不 同 的 原因 在 于 ， 通常 是 将 EQ? 实 现 为 一 种 指针 的 比较 
(然而 两 个 给 定 的 指针 会 指向 相同 的 地 方 吗 )， 而 且 稼 稼 两 个 完全 一 样 的 链表 并 没有 在 内 存 中 进 
行 复制 。 当 Scheme 中 的 系统 产生 一 个 链表 时 ， 它 会 检查 是 否 已 经 有 这 样 的 一 个 链表 。 如 果 有 ， 
新 的 链表 将 仅仅 是 一 个 指向 已 经 存在 的 链表 的 新 指针 。 在 这 种 情况 下 ， EQ? 将 判断 这 两 个 链表 
相等 。 然 而 在 某 一 些 情 况 下 ， 要 查 出 一 个 相同 的 链表 是 否 存 在 ， 可 能 是 困难 的 ， 此 时 就 将 创建 
一 个 新 的 链表 。 在 这 种 现象 里 EQ? 将 产生 #F。 

注意 ， 可 以 将 EQ? 作 用 于 符号 原子 ， 但 是 不 一 定 能 够 将 它 作 用 于 数值 原子 。= 谓词 则 能 够 
作用 于 数值 原子 ， 但 是 不 一 定 能 作用 于 符号 原子 。 正如 在 上 面 所 讨论 过 的 ， 也 不 能 够 将 EQ? 可 
靠 地 作用 于 链表 参数 。 \ 

在 不 知道 两 个 原子 是 符号 的 还 是 数值 的 情形 ， 如 果 外 E 够 进行 相等 测试 ， 有 时 会 很 方便 。 为 
a E EMN? 可 避 党 它 信用 导数 全 的 和 鬼 导 的 飞 于 。 使 用 EQ? 或 =， 
而 非 EQV? 的 主要 原因 ， 是 使 用 EQ? 和 = 可 能 比 使 用 EQV? 更 快速 。 

如 采 LIST? 谓词 函数 中 唯一 的 参数 是 一 个 链表 ， 函 数 将 返回 #T， 否则 函数 将 返回 #， 下 
如 下 面 的 示例 所 示 : 


(LIST? '(X Y)) 返回 #7 
(LIST? 'X) 返回 #F 
(LIST? '()) 返回 #7 


NULD? 国 数 测 试 它 的 参数 ， 以 决定 是 否 为 空 链表 。 如 果 是 空 链 表 就 将 返回 好。 考虑 下 面 的 
例子 : 


(NULL? '(A B)) 返回 #F 


(NULL? '()) 返回 #T 
(NULL? 'A ) 返回 #F 
(NULL? '(())) 返回 #F 


因为 参数 不 是 空 链表 ， 所 以 在 最 后 这 种 情况 下 返回 #F。 这 个 参数 是 一 个 包含 了 空 链表 元 素 


15.5.10 ” Scheme 函数 示例 


本 市 介绍 Scheme 中 函数 定义 的 一 些 例子 。 这 些 程序 用 于 解决 简单 的 表 处 理 问 题 。 

考虑 一 个 给 定 的 原子 在 一 个 给 定 的 简单 链表 中 的 成 员 资格 问题 . 简单 链表 没有 子 表 。 如 果 
将 这 个 函数 命名 为 member， 可 以 将 它 使 用 如 下 : 

(member 'B '(A B C)) 返回 #7 

(member 'B '(A C D E)) 返回 #F 

从 循环 的 角度 来 考虑 成 员 资格 的 问题 ， 只 是 将 给 定 的 原子 与 给 定 的 链表 中 的 元 素 进 行 比较 ， 
按 某 种 次 序 一 次 比较 一 个 ， 直 到 发 现 了 了 一 个 匹配 或 是 链表 中 的 元 素 都 被 比较 过 了 为 止 。 也 可 以 
使 用 递归 函数 来 完成 相 类 似 的 过 程 。 这 个 函数 能 够 将 给 定 的 原子 与 链表 的 CAR 进 行 比较 。 如 果 
它们 相 匹 配 ， 将 返回 #T， 如 果 它 们 不 相 匹 配 ， 就 忽略 链表 的 CAR 部 分 ， 然后 在 链表 的 CDR 中 继 
续 进行 搜索 。 因 此 ， 函 数 应 该 以 链表 的 CDR 作 为 链表 参数 ， 来 调用 它 的 本 身 ， 并 且 返 回 该 递归 
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调用 的 结 采 。 如 于 所 找 的 原子 不 在 链表 中 ， 这 个 函数 最 终 被 (AC) 调用 时 的 实 参 将 会 是 一 个 
空 链表 。 这 将 迫使 它 返 回 #F 。 在 这 个 过 程 中 ， 递 归 将 会 有 两 种 结果 : 在 某 次 调用 时 链表 为 空 ， 
并 且 返 回 #F; 或 者 是 发 现 了 一 个 匹配 ， 并 且 返 回 #T。 
总 而 言 之 ， 这 个 函数 必须 处 理 三 种 情况 : 一 个 为 空 的 输入 链表 、 原 子 和 链表 的 CAR 之 间 的 
一 个 匹配 ， 以 及 原子 与 链表 的 CAR 之 间 的 不 匹配 ， 这 将 导致 递归 调用 。 它 们 正 是 COND 的 三 个 参 
数 ， 最 后 一 个 是 由 ELSE 所 激发 的 默认 的 情形 。 这 个 完整 的 函数 应 该 是 : 
(DEFINE (member atm lis) 
(COND 
((NULL? lis) #F) 
((EQ? atm (CAR lis)) #T) 
(ELSE (member atm (CDR lis))) 
)) 


这 种 形式 是 简单 Scheme 表 处 理 函 数 的 典型 。 在 这 种 函数 中 ， 对 于 链表 中 的 数据 的 处 理 ， 一 
次 一 个 元 素 。CAR 可 以 得 到 单个 的 元 素 ， 通 过 在 链表 的 CDR 上 使 用 递归 而 继续 这 个 过 程 。 

值得 注意 的 是 ， 因 为 应 用 空 链 表 的 CAR 是 一 个 错误 ， 所 以 对 于 空 链 表 的 测试 必须 是 在 等 于 
测试 之 前 。 

男 外 的 一 个 示例 ， 考 虑 决定 两 个 给 定 的 链表 是 否 相 等 的 问题 。 如 果 这 两 个 链表 是 简单 链表 ， 
问题 的 解决 相对 容易 ， 虽 然 会 涉及 一 些 读者 可 能 不 熟悉 的 程序 设计 技术 。 下 面 是 一 个 名 称 为 
equalsimp 的 、 用 于 比较 简单 链表 的 谓词 函数 ， 

(DEFINE (equalsimp lisl lis2) 

(COND 
( (NULL? lisl) (NULL? lis2)) 
((NULL? lis2) #F) 
((EQ? (CAR lisl) (CAR lis2)) 
(equalsimp (CDR lisl) (CDR lis2))) 
(ELSE #F) 
)) 


由 COND 的 第 一 个 参数 所 处 理 的 第 一 种 情况 中 ， 第 一 个 链表 参数 是 空 链表 。 如 果 第 一 个 链表 
参数 本 来 就 为 空 ， 这 种 情况 则 可 能 发 生 在 一 个 外 部 调用 中 。 因 为 一 个 递归 调用 使 用 两 个 参数 链 
表 的 CDR 来 作为 它 的 参数 ， 如 果 第 一 个 链表 中 的 全 部 元 素 都 被 前 面 的 递归 调用 删除 了 ， 第 一 个 
链表 在 这 种 调用 中 就 可 能 是 空 的 。 当 第 一 个 链表 为 空 时 ， 就 必须 对 第 二 个 链表 进行 检测 ， 以 确 
定 它 契 否 也 为 空 。 如 果 正 是 如 此 ， 它 们 两 者 就 是 相等 的 (或 者 它们 本 来 就 相等 ， 或 者 所 有 前 面 
的 递归 调用 之 中 的 CAR 是 相等 的 )， 并 且 NULL? 将 正确 地 返回 #T。 如 果 第 二 个 链表 不 为 空 ， 它 
束 将 比 第 一 个 链表 大 ， 并 且 NULL? 应 该 返回 #F。 回 忆 一 下 ， 一 个 谓词 函数 返回 任何 非 空 链表 
都 被 解释 为 #T。 

第 二 种 情况 是 第 二 个 链表 是 为 空 ， 而 第 一 个 链表 则 不 是 。 只 有 当 第 一 个 链表 比 第 二 个 大 时 
才 会 发 生 这 种 情形 。 因 为 第 一 种 情况 捕捉 了 第 一 个 链表 为 空 的 所 有 可 能 的 实例 ， 因而 仅仅 必须 
测试 第 二 个 链表 。 

第 三 种 情况 是 在 两 个 链表 中 相对 应 的 元 素 之 间 进 行 相等 测试 的 递归 步骤 它 通 过 比较 两 个 
非 空 链表 的 CAR 来 完成 这 个 步骤 。 如 果 它 们 是 相等 的 ， 那么 这 两 个 链表 直到 这 一 点 都 是 相等 的 ， 
然后 将 递归 用 于 两 者 的 CDR。 当 发 现 了 两 个 不 相等 的 原子 时 ， 这 种 情况 将 失败 。 如 果 是 这 样 的 
话 ， 就 不 再 需要 继续 这 一 过 程 ， 因 此 选择 默认 的 ELSE， 它 将 返回 #F。 

注意 ，equalsimp 的 期 望 参数 是 链表 ， 如 果 两 个 参数 之 一 或 这 两 者 都 是 原子 ， equalsimp 


why HA AZ RA ES f 445 


就 不 能 正确 地 操作 。 
一 般 链表 的 比较 问题 比 人 简单 链表 的 比较 稍微 复杂 一 些 ， 这 是 因为 在 比较 过 程 中 ， 必 须 对 子 
表 全 面 追踪 。 此 时 递归 特别 适用 ， 因 为 子 表 的 形式 与 所 给 定 的 链表 相同 。 在 任何 时 候 ， 如 果 两 
个 给 定 的 链表 中 相对 应 的 元 素 是 链表 ， 则 将 它们 分 成 为 两 个 部 分 ， 即 CAR 和 CDR， 而 且 将 递归 
应 用 于 这 两 个 部 分 。 这 正 是 “分 治 ”方式 的 用 途 的 一 个 完美 示例 。 如 果 两 个 给 定 链表 中 相对 应 
的 元 素 是 原子 ， 就 使 用 EQ? 来 进行 比较 。 
这 个 完整 函数 的 定义 如 下 : 
(DEFINE (equal lisl lis2) 
(COND 
((NOT (LIST? lisl)) (EQ? lisl lis2)) 
((NOT (LIST? lis2)) #F) 
( (NULL? lisl) (NULL? lis2)) 
((NULL? lis2) #F) 
((equal (CAR lisl) (CAR lis2)) 
(equal (CDR lisl) (CDR lis2))) 
(ELSE #F) 
)) 


COND 的 前 两 种 情况 处 理 的 是 其 中 任何 一 个 参数 是 一 个 原子 ， 而 不 是 链表 的 情形 。 第 三 和 第 
四 种 情况 则 是 其 中 的 一 个 或 两 个 链表 为 空 的 情形 。 这 些 情况 也 被 用 来 防止 后 来 试图 将 cAR 应 用 
于 空 链 表 。 第 五 个 COND 的 情况 是 最 有 趣 的 一 种 。 这 里 的 谓词 是 参数 为 链表 的 CAR 的 一 个 递归 调 
用 。 如 果 调 用 返回 #T， 那 么 递归 将 再 一 次 被 用 于 链表 的 CDR、 这 里 允许 了 两 个 链表 包括 任意 深 
度 的 子 表 。 

可 以 将 equal 的 定义 用 于 任何 表达 式 对 ， 而 不 仅仅 是 链表 equal 与 系统 谓词 函数 
EQUAL? 是 等 价 的 。 注 意 ， 应 该 只 有 在 必需 的 时 候 才 使 用 EQUAL? (不 知道 实 参 的 形式 ) ， 因 为 
它 比 EQ8? 和 EQV? 慢 得 多 。 

尺 外 一 个 普遍 需要 的 链表 操作 是 构造 一 个 包含 了 两 个 给 定 的 链表 参数 中 的 所 有 元 素 的 新 链 
表 。 通 常 ， 这 是 通过 实现 一 个 被 称 为 append 的 Scheme 函 数 来 完成 的 ， 获取 结果 是 通过 重复 地 
使 用 CONS 从 而 将 第 一 个 参数 链表 中 的 元 素 放 入 到 第 二 个 参数 链表 内 。 最 后 ， 第 二 个 参数 链表 将 
成 为 计算 的 结果 。 为 了 清晰 了 解 append 的 行为 ， 考 虑 下 面 的 例子 ， 


(append ‘(A B) '(C D R)) 返回 (ABCD R) 
(append '((A B) C) '(D (E F))) 返回 ((A B) C D (E F)) 
append 畏 数 的 定义 为 : 
(DEFINE (append lisl lis2) 
(COND 


((NULL? lisl) lis2) 
(ELSE (CONS (CAR lisl) (append (CDR Lisl) lis2))) 
)) 


第 一 种 COND 的 情况 是 用 来 在 第 一 个 参数 链表 为 空 时 ， 终止 递归 过 程 并 返回 第 二 个 链表 。 在 
第 二 种 CONS 情 况 (ELSE) F, 第 一 个 参数 链表 中 的 CAR 部 分 与 递归 调用 所 返回 的 结果 相连 接 ， 
这 个 递归 调用 将 第 一 个 链表 中 的 CDR 部 分 作为 第 一 个 参数 来 传递 。 

考虑 下 面 一 个 名 为 guess 的 Scheme 函 数 ， 它 使 用 在 本 节 中 所 描述 的 member 函 数 。 读 者 在 
阅读 下 面 关 于 它 的 描述 前 ， 应 试 着 去 判断 它 的 功能 ， 假设 参数 是 简单 的 链表 。 


(DEFINE (guess lisl lis2) 
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(COND 
((NULL? lisl) '()) 
( (member (CAR 1is1) lis2) 
(CONS (CAR lisl) (guess (CDR lisl) lis2))) 


(ELSE (guess (CDR lisl) lis2)) 

)) 

guess 产 生 一 个 包含 了 它 的 两 个 参数 链表 中 的 共同 元 素 的 简单 链表 。 所 以 如 果 将 参数 链表 
表示 为 集合 的 话 ，guess 计 算出 的 正好 是 一 个 表示 这 两 个 集合 之 交 的 链表 。 

LET 是 一 个 函数 ， 它 允许 将 名 字 暂 时 绑 定 于 子 表达 式 的 值 上 。 篆 常 将 它 用 于 从 一 些 比 较 复 
杂 的 表达 式 中 分 解 出 共同 的 子 表达 式 。 然 后 能 够 将 这 些 子 表达 式 的 名 字 用 于 另外 一 个 表达 式 的 
求 值 中 。LET 函 数 的 一 般 形式 是 : 

(LET i 

(名 字 _1 表达 式 _1) 

(名 字 _2 表达 式 _2) 


(名 字 _n 表达 式 _n)) 

表达 式 {表达 式 } 

) 

LET 的 语义 是 首先 对 "个 表达 式 求 值 ， 将 产生 的 值 绑 定 到 与 它们 相关 的 名 字 上 。 然 后 再 对 函 
数 体 中 的 表达 式 求 值 。LET 的 结果 是 它 的 函数 体 中 最 后 一 个 表达 式 的 值 。 下 面 举例 来 说 明 LET 
的 用 法 。 例 子 中 的 函数 将 计算 二 次 方程 的 根 ， 我 们 假设 是 实 根 。” 


(DEFINE (quadratic roots a b c) 


(LET ( 
(root part over 2a 
(/ (SORT (= (=B bJ (*.4 a -Gy A 2-4))) 
(minus b over 2a (/ (- 0 b) (* 2 a))) 


) 


( LIST (+ minus_b over 2a root part over 2a) 
(- minus b over 2a root part over 2a)) 


) 

上 面 例子 使 用 LIST 来 创建 组 成 结果 的 两 个 值 的 列表 。 

LET 创 建 一 种 新 的 局 部 静态 作用 域 ， 其 方式 与 Ada 中 的 declare 的 方式 大 致 相同 。 新 的 变量 
可 以 被 创建 、 使 用 ， 然 后 当 到 达 新 的 作用 域 的 末尾 时 被 丢弃 。LET 的 命名 组 成 部 分 十 分 类 似 于 赋 
值 语句 ， 但 是 只 能 够 将 它们 用 于 新 的 作用 域 。 此 外 ， 还 不 能 够 在 LET 中 将 它们 重新 绑 定 到 新 值 。 

实际 上 ，LET 是 LAMBDA 表 达 式 的 一 种 速记 形式 。 下 面 的 这 两 个 表达 式 是 等 价 的 : 


(LET ((alpha 7))(* 5 alpha)) 
((LAMBDA (alpha) (* 5 alpha)) 7) 


在 第 一 个 表达 式 中 ， 通 过 LET，7 与 alpha 相 绑 定 ; 在 第 二 个 表达 式 中 ， 通 过 LAMBDA 表 达 
式 的 参数 ，7 与 aLpha 相 绑 定 。 


15.5.11 函数 形式 
本 节 将 描述 两 种 由 Scheme 提 供 的 常用 数学 函数 的 形式 ， 即 复合 和 “应 用 到 所 有 参数 ”的 消 


© Scheme 的 某 些 版 本 将 复数 包括 为 数据 类 型 ， 并 且 将 计算 方程 的 根 ， 而 不 论 它 们 是 实数 还 是 复数 。 
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数 形 式 。 我 们 已 经 在 15.2.2 小 节 里 给 出 了 这 两 种 函数 形式 的 数学 定义 。 

15.5.11.1 函数 复合 

函数 复合 是 最 初 的 LISP 所 提供 的 唯一 的 原始 函数 形式 。 所 有 后 来 的 LISP 方 言 , 包括 Scheme, 
也 都 提供 了 这 种 函数 形式 。 函 数 复合 是 EVAL 工 作 机 理 的 本 质 。 在 使 用 EVAL 时 ， 将 所 有 的 非 引 
述 的 链表 都 解释 成 为 函数 调用 ， 这 就 要 求 首先 对 它们 的 参数 求 值 。 这 个 过 程 将 被 递归 地 应 用 到 
表达 式 中 最 小 的 链表 上 。 这 正 是 函数 复合 的 含义 。 下 面 的 例子 说 明了 函数 复合 : 


(CDR (CDR '(A B C))) 返回 (C) 

(CAR (CAR '((A B) B C))) RE A 

(CDR (CAR '((A B C) D))) 返回 (B C) 

(NULL? (CAR ‘'(() B C))) 返回 #T 

(CONS (CAR '(A B)) (CDR '(A B))) 返回 (A B) 

注意 ， 国 数 名 在 内 层 调 用 中 不 被 引述 ， 这 是 因为 必须 对 于 它们 求 值 ， 而 不 是 将 它们 作为 字 
面 常 量 数据 来 处 理 。 


一 些 最 常用 的 Scheme 国 数 复合 被 内 建 为 单一 国 数 。 例 如 ，(CRARAR x) 等 价 于 (CAR (CAR 
x) ) (CADR x) 等 价 于 (CAR (CDR x)), (CADDAR x) 等 价 于 (CAR(CDR(CDR(CRAR x))))., 
在 函数 名 中 “c” 和 “R” 之 间 A 和 D 的 任意 组 合 (最 多 为 4 个 ) 都 是 合法 的 。 

15.5.11.2 一 种 “应 用 到 所 有 参数 ”的 函数 形式 

在 通常 的 函数 式 程序 设计 语言 中 所 提供 的 最 常用 的 函数 形式 ， 是 数学 的 “应 用 到 所 有 参数 ” 
函数 形式 的 变 体 。 最 简单 的 是 mapcar， 它 具有 两 个 参数 ， 其 中 的 一 个 是 函数 ， 另 外 的 一 个 则 
是 链表 。mapcar 将 给 定 的 国 数 应 用 到 给 定 链表 中 的 每 个 元 素 上 ， 而 且 它 将 返回 一 个 链表 ， 其 
中 的 元 素 就 是 这 些 应 用 的 结果 。Scheme 中 的 mapcar 的 定义 为 : 

(DEFINE (mapcar fun lis) 

(COND 
((NULL? lis) '()) 
(ELSE (CONS (fun (CAR lis)) (mapcar fun (CDR lis)))) 

)) 

注意 ，mapcar 的 人 简单 形式 ， 它 表达 了 一 个 复杂 的 函数 形式 。 这 正 是 Scheme 语 言 的 强大 表 
达能 力 的 一 种 证 明 。 

作为 mapcar 的 使 用 的 一 个 例子 ， 假 设 我 们 想 要 计算 一 个 链表 中 所 有 元 素 的 立方 。 我 们 能 
够 通过 使 用 下 面 的 图 数 来 完成 : 

(mapcar (LAMBDA (num) (* num num num)) '(3 4 2 6)) 

这 个 调用 将 返回 (27 64 8 216), 

注意 ， 在 这 个 例子 中 的 mapcar 的 第 一 参数 是 一 个 LAMBDA 表 达 式 。 当 EVAL 在 计算 LAMBDA 
表达 式 时 ， 它 构造 了 一 个 函数 ， 这 个 函数 除了 是 无 名 称 的 之 外 ， 与 任何 预定 义 的 函数 都 有 着 相 
同 的 形式 。 在 上 面 的 表达 式 中 ， 这 个 无 名 函数 立刻 被 应 用 到 参数 链表 中 的 每 个 元 素 上 ， 并 且 将 
其 结果 返回 到 一 个 链表 中 。 


15.5.12 产生 代码 的 函数 


程序 和 数据 具有 相同 结构 的 事实 可 以 被 发 展 来 构造 程序 。 回 忆 Scheme 的 解释 器 ， 就 是 一 个 
称 为 EVAL 的 函数 。Scheme 系 统 将 EVRL 应 用 于 每 一 个 键 和 的 表达 式 。 Scheme 程序 也 能 够 直接 地 
调用 EVAL 函 数 。 这 样 ，Scheme 程 序 就 能 够 构造 其 他 的 程序 ， 并 且 能 够 调用 EVAL 来 对 它们 求 值 。 

这 个 过 程 的 最 简单 的 例子 之 一 涉及 数值 原子 。 大 部 分 的 Scheme 系 统 ， 包 括 + 函 数 ， 这 个 函 
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数 以 任意 数目 的 数值 原子 为 参数 ， 并 且 和 返回 它们 之 和 。 例 如 ，(+ 3 7 10 2) 将 返回 22。 

我 们 的 问题 是 : 假设 在 一 个 程序 中 ， 我 们 有 一 个 数值 原子 的 链表 ， 并 需要 求 取 它们 之 和 。 
我 们 不 能 够 直接 将 + 应 用 到 链表 上 ， 因 为 + 只 取 原 子 参数 而 不 是 一 个 数值 原子 的 链表 。 当 然 ， 我 
们 可 以 编写 一 个 函数 ， 这 个 函数 将 使 用 递归 来 穿 过 整个 链表 ， 重 复 地 把 链表 的 CAR 加 入 到 它 的 
CDR 之 和 。 下 面 就 是 这 样 一 个 函数 : 

(DEFINE (adder lis) 

(COND 
((NULL? lis) 0) 
(ELSE (+ (CAR lis) (adder (CDR lis)))) 

)) 
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交 给 EVAL 求 值 ， 如 下 面 的 这 个 函数 ; 
(DEFINE (adder lis) 
(COND 
((NULL? lis) 0) 
(ELSE (EVAL (CONS '+ lis))) 
)) 


注意 ， 此 处 加 法 函数 的 名 字 被 引述 ， 以 防止 EVAL 在 coONS 的 求 值 中 对 它 求 值 。 作 为 一 个 例 
考虑 下 面 的 调用 : 


(adder '(3 4 6)) 


这 个 调用 将 引起 adder 建 立 链表 

(+ 3 4 6) 

然后 将 链表 提交 给 EVAL，EVAL 调 用 + 并 返回 结果 13。 

在 所 有 Scheme 的 比较 早期 的 版 本 中 ， EVAL 函 数 在 程序 的 最 外 作用 域 中 计算 它 的 表达 式 。 
最 新 版 的 Scheme ( 即 Scheme 4) 要 求 EVAL 具 有 第 二 个 参数 ， 以 说 明 是 在 哪 一 个 作用 域 中 进行 
表达 式 的 计算 。 为 了 简单 起 见 ， 我 们 在 示例 中 没有 包括 作用 域 参数 ， 而 且 我 们 在 这 里 也 不 讨论 
作用 域 的 名 字 。 


15.6 COMMON LISP 


COMMON LISP (Steele, 1984) 是 将 几 种 20 世 纪 80 年 代 初 期 的 LISP 方 言 的 特性 结合 进 一 种 
语言 的 结果 ， 这 些 方言 也 包括 Scheme。 作 为 组 合 的 结果 ，COMMON LISP 是 一 种 大 型 并 且 相 当 
复杂 的 语言 。 然 而 ， 它 的 基础 是 最 初始 的 LISP 语 言 ， 因 而 它 的 语法 、 原始 国 数 和 基本 性 质 都 来 
目 于 LISP 语 言 。 

设计 人 员 认 识 到 动态 作用 域 所 提供 的 灵活 性 和 静态 作用 域 的 简单 性 ，COMMON LISP 人 允许 
对 这 两 种 作用 域 的 使 用 。 上 默认 的 变量 作用 域 是 静态 的 ， 但 是 如 果 声 明 一 个 变量 是 “special”， 这 
个 变量 的 作用 域 就 成 为 动态 的 。 

COMMON LISP 具 有 一 长 列 的 特性 : 多 种 数据 类 型 和 结构 ， 包 括 记 录 、 数 组 复数 和 字符 
串 等 ， 强 有 力 的 输入 和 输出 操作 ， 将 一 系列 函数 和 数据 模块 化 的 包 ， 还 提供 访问 控制 。 

在 茶 种 意义 上 ，Scheme 和 COMMON LISP 是 相反 的 。 Scheme 较 为 小 型 化 ， 而 且 比 较 简 洁 ， 
其 中 的 部 分 原因 是 由 于 它 仅 仅 使 用 静态 作用 域 。COMMON LISP 是 一 种 商业 语言 ， 并 且 成 功 地 
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成 为 人 工 智能 应 用 中 的 一 种 广泛 使 用 的 语言 。 另 一 方面 ，Scheme 常 常 被 用 于 大 学 的 函数 式 程序 
设计 课程 。 因 为 它 相 对 小 型 ， 可 以 将 它 用 于 函数 式 语言 的 研究 。 而 使 得 COMMON LISP 成 为 一 
种 极为 大 型 语言 的 一 个 重要 设计 方针 ， 是 为 了 使 它 与 LISP 的 一 些 较 早 期 的 方言 相 兼 容 。 
COMMON LISP 正 是 产生 于 这 些 方言 的 。 


15.7 ML 


ML (Milner et al., 1990) 也 像 Scheme 一 样 ， 是 一 种 静态 作用 域 的 国 数 式 程序 设计 语言 。 
然而 ， 在 许多 的 重要 方面 它 又 不 同 于 LISP 及 其 方言 ， 包 括 Scheme。 也 许 其 中 最 重要 的 区 别 是 
ML 是 强 类 型 的 语言 ， 而 Scheme 实质 上 是 无 类 型 的 语言 。ML 有 具有 类 型 声明 ， 并 使 用 类 型 推理 
(曾经 在 第 5 章 人 简略 地 讨论 过 )。 由 于 使 用 了 类 型 推理 ， 常 常 就 不 需要 变量 声明 。 每 一 个 变量 和 表 
达 式 的 类 型 都 能 够 在 编译 时 间 被 确定 。Scheme 和 ML 之 间 另 外 一 个 重要 的 区 别 ， 是 ML 所 使 用 的 
语法 更 接近 于 命令 式 语言 的 语法 ， 而 不 是 LISP 的 。 例 如 ，ML 中 的 算术 表达 式 使 用 中 绿 标 记 。 

ML 具有 异常 处 理 ， 还 有 实现 抽象 数据 类 型 的 模块 化 设施 。 我 们 曾经 在 第 2 章 里 简略 地 描述 
过 它 的 发 展 历 史 和 主要 的 特性 。 

在 ML 中 函数 声明 的 一 般 形式 为 : 

fun HRE OES) = HAAREN; 


例如 ， 

fun square (x : int) = x * x; 

可 以 在 参数 表 之 后 说 明 返 回 值 类 型 ， 例 如 

fun Square(X : int) : int = x * x; 
当然 在 这 个 函数 中 ， 不 需要 显 式 地 说 明 返 回 值 类 型 。 
下 面 这 一 行 

fun square (x) = X * X; 


定义 了 一 个 与 前 一 个 国 数 定义 相同 的 函数 。ML 假 设 表达 式 (x* x) 中 的 操作 符 的 类 型 为 int 
(x 是 数值 类 型 )。 因 而 ， 使 用 算术 操作 符 的 函数 不 能 够 是 多 态 的 。 同 样 ， 使 用 关系 操作 符 ( 除 
了 = 和 <> 以 外 ) 以 及 布尔 操作 符 的 函数 也 不 能 够 是 多 态 的 。 然 而 那些 仅仅 使 用 链表 的 操作 ，=、 
<> 和 元 组 操作 符 (用 来 形成 元 组 ， 以 及 施行 元 素 的 选择 ) 的 函数 则 可 以 是 多 态 的 。 

如 果 我 们 已 经 定义 了 一 个 int 类 型 的 square 国 数 ， 现 在 又 需要 定义 一 个 zeal 类 型 的 
square 国 数 。 此 时 ， 我 们 必须 使 用 不 同 的 名 字 来 进行 定义 ， 原 因 是 ML 不 允许 用 户 定 义 的 重 载 
函数 。 另 外 ， 如 果 我 们 将 square 函 数 定 义 为 real 类 型 ， 调 用 它 时 的 实 参 就 不 能 够 是 整数 的 ， 
原因 是 ML ( 同 Ada 一 样 ) 不 会 将 整数 值 强 制 转换 成 为 real 类 型 。 

ML 的 选择 控制 流程 结构 与 命令 式 语言 相似 。 它 具有 以 下 形式 的 条 件 表达 式 : 

if 表达 式 then then 表达 式 else else 表达 式 

必须 将 其 中 的 第 一 个 表达 式 计 算 为 布尔 值 。 

在 ML 中 ，Scheme 的 条 件 表 达 式 可 以 出 现在 国 数 定 义 层 次 上 。 在 Scheme 中 ， 是 使 用 COND 图 
数 来 确定 给 定 参数 的 值 ， 而 被 确定 的 值 又 能 够 反 过 来 说 明 COND 所 和 返回 的 值 。 在 ML 中 ， 针 对 给 
定 参 数 的 不 同形 式 ， 可 以 定义 函数 来 完成 计算 。 这 种 特征 是 为 了 模仿 数学 中 的 条 件 函 数 定义 的 
形式 及 意义 。 在 ML 中 , 定义 返回 值 的 那个 特定 表达 式 是 通过 对 给 定 参 数 进行 模式 匹配 来 选择 的 。 
例如 ， 如 果 不 使 用 这 种 模式 匹配 的 话 ， 可 以 将 计算 阶乘 的 函数 写成 下 面 的 形式 : 
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fun fact(n : int): int = if n = 0 then 1 
else n * fact(n - 1); 


而 如 末 使 用 参数 模式 匹配 ， 我 们 就 可 以 具有 函数 的 多 重 定义 。 使 用 OR 符号 (| ) 来 隔 开 依赖 于 


参数 形式 的 不 同 函数 定义 。 例 如 ， 如 果 使 用 模式 匹配 ， 可 以 将 计算 阶乘 的 函数 写成 下 面 的 形式 .: 


fun fact(0) = 1 
| fact(n : int): int = n * fact(n - 1); 


如 果 是 用 实 参 0 来 调用 fact ， 就 使 用 其 中 的 第 一 个 定义 。 如 果 是 以 一 个 非 零 的 int 数 值 来 


调用 fact， 就 使 用 其 中 的 第 二 个 定义 。 


ML 具有 链表 和 链表 操作 ， 但 是 它们 看 起 来 与 Scheme 中 的 不 同 。 链 表 是 使 用 方 括号 来 说 明 ， 
链表 元 素 使 用 逗号 来 分 隔 。 下 面 是 一 个 整数 链表 ; 

(5; Ts 9] 

[是 一 个 空 链 表 。 空 链表 也 可 以 用 ni1 来 说 明 。 

Scheme 的 CONS 函 数 在 ML 中 是 一 个 二 元 前 置 操作 符 ， 使 用 : : 来 表示 。 例 如 : 

3 2? £5, Sp 9] 

其 求 值 结果 为 [3, 5, 7, 9]。 

一 个 链表 中 的 元 素 必 须 都 是 同一 类 型 的 ， 因 此 下 面 的 链表 是 非法 的 ; 

[Sy 7.35 9 

ML 具有 对 应 于 Scheme 中 的 CAR 和 CDR 的 函数 ， 它 们 的 名 称 分 别 为 hda 和 t1， 也 即 head (2k) 
和 tail (Æ) 的 缩写 。 例 如 : 

hd [5, 7, 9]is5 

tl (15, 7%, Sis (7, 9) 

由 于 可 以 使 用 有 模式 的 函数 参数 ， 在 ML 中 对 于 hd 和 t1 函 数 的 使 用 远 不 如 在 Scheme 中 的 频 
繁 。 例 如 在 一 个 形 参 中 ， 表 达 式 

(h :: 七 ) 

实际 上 是 两 个 形 参 ， 它 们 即 是 所 给 定 链表 参数 的 头 和 尾 ， 而 对 应 的 实 参 是 列表 。 例 如 ， 可 
以 使 用 下 面 的 函数 来 计算 一 个 给 定 链表 参数 中 的 元 素 的 数目 ， 

fun length([]) = 0 

| length(h :: t) = 1 + length(t); 

作为 这 些 概念 的 另外 一 个 示例 ， 我 们 来 考虑 append 函 数 ， 这 个 函数 的 功能 与 Scheme 中 的 
APPEND AL FAIA : 

fun append([{], lis2) = lis2 

| append(h :: t, lis2) = h :: append(t, lis2); 

这 个 函数 的 第 一 个 选项 处 理 的 是 函数 调用 中 的 第 一 个 参数 为 空 链表 的 情况 。 即使 最 初 的 函 
数 调用 中 的 第 一 个 参数 不 为 空 ， 这 个 选项 也 用 来 终止 递归 。 图 数 的 第 二 个 选项 将 第 一 个 参数 链 
表 lis 拆 为 头 与 尾 (CAR 与 CDR) 两 个 部 分 。 将 头 部 分 连接 到 递归 调用 的 结果 之 上 。 递 归 调 用 的 
第 一 个 参数 就 是 尾部 分 。 

在 ML 中 ， 通 过 以 下 形式 的 值 声明 语句 ， 将 名 字 绑 定 到 值 之 上， 

val 新 名 字 = 表达 式 ; 

例如 ， 
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val distance = time * speed; 

不 要 认为 这 个 语句 与 命令 式 语 言 中 的 赋值 语句 完全 一 样 ， 实 际 上 它 并 不 是 。val 语 名 将 一 
个 名 字 绑 定 到 一 个 值 上 ， 但 是 在 以 后 ， 不 能 够 重新 将 这 个 名 字 再 绑 定 到 一 个 新 的 值 。 当 然 ， 在 
某 种 意义 上 也 许 能 够 。 但 是 实际 上 ， 如 果 你 的 确 是 使 用 第 二 个 val 语 名 来 将 一 个 名 字 重 新 绑 定 
的 话 ， 这 将 在 环境 中 产生 一 个 新 的 实体 ， 而 这 个 实体 与 这 个 名 字 的 早先 的 版 本 无 关 。 事 实 上 ， 
在 新 的 绑 定之 后 ， 旧 的 环境 的 入 口 〈 用 于 先前 的 绑 定 的 ) 已 经 不 再 可 见 。 并 且 ， 新 绑 定 的 类 型 
并 不 需要 与 先前 绑 定 的 相同 。val1 语 句 没 有 副作用 。 这 种 语句 只 是 简单 地 将 一 个 名 字 加 入 到 当 
前 的 环境 中 ， 并 且 将 它 绑 定 到 一 个 值 上 ， 就 像 Scheme 中 的 LET 特 殊 形式 一 样 。val 通 常用 于 
let 表 达 式 中 ， 它 的 一 般 形式 为 : 

let val 新 名 字 = 表达 式 1 in 表达 式 2 end 

例如 ， 


let 
val pi = 3.14159 
en * radius * radius 
end; 
在 ML 中 不 存在 强制 类 型 转换 ， 操 作 符 或 赋值 的 操作 数 类 型 必须 相同 ， 以 避免 语法 错误 。 
ML 还 具有 枚 举 类 型 、 数 组 以 及 元 组 ， 它 们 类 似 于 记录 。 


15.8 Haskell 


Haskell 语 言 (Thompson, 1996) 在 下 述 的 这 些 方 面 与 ML 相 类 似 : 它 使 用 一 种 相 类 似 的 语 
法 ， 它 是 静态 作用 域 的 ， 它 也 是 强 类 型 的 ， 并 且 还 使 用 一 种 相同 的 类 型 推理 方式 。Haskell 所 具 
有 的 两 个 特征 又 使 得 它 不 同 于 ML。 首 先 ，Haskell 的 函数 能 是 多 态 的 (ML 语言 的 大 部 分 函数 都 
不 是 ) 其 次 ，Haskell 使 用 不 严格 的 语义 ， 而 ML (和 大 多 数 其 他 程序 设计 语 ) 使 用 严格 的 语义 。 
本 市 后 面部 分 将 深入 讨论 不 严格 语义 和 多 态 性 。 

在 本 节 中 的 代码 使 用 Haskell 的 1.4 版 本 来 编写 。 

考虑 下 面 的 阶乘 图 数 的 定义 ， 这 个 函数 在 参数 上 使 用 模式 匹配 。 

fact 0 = 1 

fact n = n * fact (n = 1) 

请 注意 这 个 定义 与 15.7 节 中 ML 的 阶乘 国 数 定义 之 间 的 区 别 。 第 一 ， 这 里 没有 使 用 保留 字 来 
引出 函数 定义 (ML 中 使 用 fun)。 第 二 ， 没 有 使 用 括号 来 为 形 参 定 界 。 第 三 ， 函 数 的 所 有 (A 
有 不 同形 参 的 ) 不 同 定义 都 有 相同 的 外 表 。 

使 用 模式 匹配 ， 我 们 就 能 够 定义 一 个 图 数 来 计算 第 ?个 斐 波 纳 契 数字 : 


fib 0 = 1 
fib 1 = 1 
Eib (n + 2) = fib (n+ 1) + fib n 
可 以 将 守卫 加 到 函数 定义 的 行 上 ， 以 说 明定 义 可 能 的 应 用 环境 。 例 如 ， 
fact n 
| n==0=1 


O ”可 以 将 这 个 环境 认为 是 一 种 符号 表格 ， 这 个 表格 存储 名 字 ， 还 在 执行 时 存储 这 些 名 字 所 绑 定 的 值 。 
O 在 ML 语言 中 使 用 的 括号 实际 上 也 是 可 选 的 。 
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| n> 0=n * fact(n = 1) 


这 种 阶乘 的 定义 比 我 们 在 前 面 讨论 过 的 更 为 精确 ;因为 它 将 参数 限制 在 能 够 工作 的 范围 之 
内 。 在 这 种 使 用 中 的 模式 匹配 必然 会 失败 ， 因 为 两 个 值 表达 式 的 参数 模式 都 是 x。 在 基于 数学 表 
达 式 之 后 ， 这 种 函数 定义 的 形式 称 为 条 件 表 达 式 (conditional expression) 。 

能 够 将 一 条 otherwise 语 句 作为 最 后 一 个 条 件 放 置 在 条 件 表示 式 中 ， 它 的 语义 是 明显 的 。 


例如 ， 
sub n 
| n < 10 = 0 
| n > 100 = 2 
| otherwise = 1 


注意 ， 第 8 章 讨论 过 这 里 的 守卫 和 守卫 命令 的 相似 性 。 
考虑 下 面 的 函数 定义 ， 它 的 目的 与 第 15.7 节 中 对 应 的 ML 函数 是 相同 的 : 


Square x = x * x 


然而 在 这 种 情况 下 ， 因 为 Haskell 支 持 多 态 ， 所 以 此 函数 能 接受 任何 数值 类 型 的 参数 。 
如 同 在 ML 中 一 样 ， 在 Haskell 中 是 将 链表 写 在 方 括号 里 ， 如 ; 


colors = ["blue", "green", "red", "yellow"] 


Haskell 中 包括 一 组 链表 操作 符 。 例 如 ， 使 用 ++ 来 连接 链表 ，: 是 CONS 的 中 绎 版 本 ，.. 被 用 
来 说 明 算术 系列 。 例 如 ， 

S ¢ fe, 7, SPS, 2 Fy 9 

[iy 8 ce LEE, 3s Se Fe 9y Hi 

[is 3,°5] t+ 'T2, 4, 6] FE fl, 3, 5,°2,74, 6] 


请 注意 ，Haskell 中 的 :操作 符 与 ML 中 的 :: 相 同 。e 使 用 : 以 及 模式 匹配 ， 我 们 就 可 以 定义 一 个 
简单 函数 来 计算 一 组 给 定数 字 的 乘积 。 

product [] = 1 

product (a:x) = a * product x 

使 用 product 可 以 将 一 个 阶乘 函数 写成 比较 简单 的 形式 : 

fact n = product [1l..n] 

Haskell 包 含 了 与 ML 的 let 和 val 相 似 的 let 结 构 。 例 如 ， 我 们 可 以 编写 ， 


quadratic root abc = 
let 
minus b over 2a = - b / (2.0 * a) 
root part over 2a 
Sqrt(b™ 2Z- 4.0 * aw ey f (2.0 * a) 


CN 
N 
一 一 


> Il 


in 
[minus_b over 2a - root_part_over 2a, 
minus_b over_2a + root part over 2a] 


链表 综合 提供 一 种 描述 表示 集合 的 链表 的 方法 。 链表 综合 的 语法 与 数学 上 常用 的 描述 集合 
的 语法 相同 ， 它 的 一 般 的 形式 为 : 
[ 体 | 限定 符 ] 
672 例如 ， 


© 十 分 有 趣 的 是 ，ML 将 “:” 用 于 给 名 字 附 加 上 名 字 类 型 ， 并 且 将 “::” 用 于 CONS， 而 Haskell 则 正好 是 以 相反 
的 方式 来 使 用 这 两 个 操作 符 。 


[ER 

定义 了 一 个 链表 ， 这 个 链表 的 元 素 为 1 一 50 之 间 的 所 有 数 的 立方 。 将 它 读 作 :一 个 nxnxn 
的 链表 ， 其 中 的 n 取 自从 1~50 的 范围 内 的 数 "。 在 此 情况 下 ， 限 定 符 以 生成 器 (generator) 的 
形式 出 现 。 它 产生 从 1 ~ 50 的 数 。 在 其 他 情况 下 ， 限 定 符 则 是 以 布尔 表达 式 的 形式 出 现 ， 这 时 
将 它们 称 为 测试 (test)。 能 够 使 用 这 种 表示 法 来 描述 许多 算法 ， 如 链表 的 交换 和 排序 之 类 。 例 
如 ， 考 虑 下 面 的 函数 ， 当 给 定数 n 时 ， 这 个 函数 将 返回 一 个 链表 ， 其 中 的 元 素 是 n 的 所 有 因数 : 

factors n= [i | i <- [1..n “div” 2], n “mod~ i == 0] 

factors 中 的 链表 综合 创建 一 个 数 的 链表 ， 其 中 的 每 一 个 数 都 临时 地 绑 定 到 名 字 i 上 ， 苑 
围 是 从 1 一 n/2， 并 满足 n mod i = 0 这 一 条 件 。 这 的 确 是 一 个 十 分 准确 而 又 简短 的 数 的 因子 的 
定义 。div 和 mod 前 后 的 反 引 号 (向 后 的 撤 号 ) 指示 这 些 函 数 的 插入 使 用 。 当 在 函数 注释 中 调 
用 它们 时 ， 如 aiv n 2， 不 使 用 反 引 号 。 

接 下 来 ， 考 虑 在 下 面 的 快速 排序 算法 的 实现 中 ，Haskell 的 强制 转换 : 

sort [] = [] 

sort (st) = sort [b | be t, b <= 地] 

++ [h] ++ 
sort [b | b <- t, b> hi 

此 程序 对 小 于 或 等 于 链表 头 的 链表 元 素 集 进 行 分 类 和 与 头 元 素 进 行 连接 ， 然 后 对 大 于 链表 
头 的 元 素 集 进 行 分 类 和 连接 到 前 一 个 结果 上 。 这 个 定义 比 命令 式 语言 中 编码 的 相同 的 算法 要 简 
短 得 多 。 

如 采 一 种 程序 设计 语言 要 求 完全 求 值 所 有 的 实 参 ， 那 么 此 语言 是 严格 的 (strict), ， 这 使 函数 
值 不 依赖 于 参数 的 求 值 次 序 。 如 果 一 种 语言 没有 这 种 严格 的 要 求 ， 那 么 此 语言 是 不 严格 的 
(nonstrict) 。 不 严格 的 语言 比 严格 的 语言 有 一 些 不 同 的 优点 。 首 先 ， 不 严格 的 语言 通常 具有 更 高 
的 效率 ， 因 为 它 避 免 一 些 求 值 过 程 。9 其 次 ， 不 严格 的 语言 具有 一 些 严 格 的 语言 不 可 能 具备 的 、 
有 趣 的 功能 。 无 限 链表 就 是 一 例 。 不 严格 的 语言 能 使 用 一 种 称 为 懒惰 求 值 (lazy evaluation) 的 
求 值 方式 ， 这 意味 表达 式 可 以 在 需要 时 再 求 值 。 

在 Scheme 中 函数 的 参数 都 在 函数 调用 之 前 求 值 。 懒 惰 求 值 意 味 着 只 有 一 个 参数 值 对 于 函数 
的 求 值 是 必需 时 ， 才 对 这 个 参数 进行 求 值 。 所 以 ， 如 果 一 个 函数 具有 两 个 参数 ， 但 是 在 函数 的 
一 个 特定 的 执行 之 中 ， 并 不 使 用 第 一 个 参数 ， 那 么 将 不 会 对 为 那个 参数 传递 的 实 参 进行 求 值 。 
此 外 ， 如 采 在 函数 的 一 个 执行 之 中 ， 必 须 被 求 值 的 只 是 实 参 的 一 部 分 ， 那 么 ， 将 不 会 对 其 余部 
分 求 值 。 最 后 ， 实 参 只 被 求 值 一 次 ， 而 不 是 每 次 都 必须 被 求 值 ， 尽 管 同一 个 实 参 在 一 次 函数 调 
用 中 出 现 多 次 。 

正如 前 面 讲 述 的 ， 懒 惰 求 值 允 许 定义 无 穷 的 数据 结构 。 例 如 ， 考 虑 下 面 的 语句 : 

positives = [0..] 

evens = [2, 4..] 

Squares = [n * n | n <- [0..]] 

显然 ， 没 有 计算 机 能 够 实际 地 表示 出 所 有 这 些 数 的 系列 ， 但 是 如 果 使 用 懒惰 求 值 ， 就 不 会 
妨碍 这 些 表 达 式 的 使 用 。 例 如 ， 如 果 我 们 想 要 知道 一 个 特定 的 数 是 否 为 一 个 完全 平方 ， 我 们 可 
以 就 使 用 一 个 成 员 资 格 函 数 来 查询 一 个 平方 表 。 假 如 ， 我 们 使 用 一 个 命名 为 nember 的 谓词 函 
数 来 确定 一 个 给 定 的 链表 中 是 否 包含 了 某 一 个 给 定 的 原子 ， 那 么 我 们 可 以 这 样 来 运用 : 


O 注意， 这 与 一 些 命令 式 语言 中 布尔 表达 式 的 短路 求 值 有 关 。 
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member squares 16 

这 个 函数 将 返回 True。 直 到 发 现 了 16， 才 会 对 squares 定 义 求 值 。 必 须 十 分 小 心地 编写 
member 国 数 。 尤 其 如 果 它 是 这 样 定 义 的 话 : 

member [] b = False 

member (a:x) b = (a == b) || member x b 

这 个 定义 中 的 第 二 行将 第 一 个 参数 拆 为 头 与 尾部 分 。 如 果 头 与 所 要 查找 的 元 素 (b) 相 匹配 ， 
函数 将 返回 True， 或 者 是 ， 如 果 是 使 用 链表 的 尾 来 进行 函数 的 递归 调用 ， 返 回 值 为 Drue。 

只 有 当 所 给 定 的 数 是 完全 平方 时 ，membez 的 这 种 定义 才能 够 正确 地 工作 。 如 果 不 是 一 个 
完全 平方 的 话 ，squares 会 永远 继续 产生 平方 ， 在 链表 中 寻找 给 定 的 数 ， 直 至 达到 了 某 种 内 存 
限制 为 止 。 下 面 的 函数 将 在 一 个 有 序 链表 中 执行 成 员 资 格 测试 ， 当 表 中 测试 的 数 比 所 要 找 的 数 
大 时 ， 尔 数 将 放弃 搜寻 并 且 返 回 False (R). 


member2 (m:x) n 
| m<n = member2 x n 
| m == n = True 
| otherwise = False 


有 时 懒惰 求 值 提供 了 一 个 模块 化 工具 。 考 虑 函数 复合 的 情形 。 假 设 程序 中 有 一 个 对 函数 
的 调用 ， 给 £ 的 参数 是 函数 g 的 返回 值 。°9 因此， 我 们 有 f(g(x))。 进 一 步 假设 g 每 次 少量 地 产 
生 大 量 的 数据 ， 则 £ 必 须 每 次 少量 地 处 理 这 些 数 据 。 使 用 懒惰 求 值 时 ， 隐 式 执 行 fE 和 g 将 会 紧 紧 
地 同步 。 函 数 g 只 产生 使 f 开 始 处 理 的 足够 的 数据 。 当 需要 更 多 数据 时 ，g 重 新 开始 产生 数据 ， 
而 此 时 开 等 待 。 如 采 革 没有 得 到 所 有 g 的 输出 就 终止 了 ， 那 么 g 中 止 其 执行 ， 这 样 避 免 了 无 用 的 计 
算 。g 也 不 需要 一 个 终止 函数 ， 也 能 因为 它 产生 了 无 限 数量 的 输出 。 当 f 终 止 时 ，g 将 被 迫 终止 。 
因此 在 懒惰 求 值 情形 下 ，g 会 运行 得 尽 可 能 少 。 这 个 求 值 过 程 支持 把 程序 模块 化 为 产生 器 单元 
和 选择 器 单元 ， 产 生 器 产生 大 量 可 能 的 结果 ， 而 选择 器 选择 正确 的 子 集 。 

懒惰 求 值 并 不 是 没有 代价 的 。 如 果 这 样 好 的 表达 能 力 和 灵活 性 是 免费 的 ， 才 肯定 会 令 人 惊 
讶 。 在 这 种 情况 下 ， 代 价 是 一 种 相当 复杂 的 语义 ， 它 将 造成 慢 得 多 的 执行 速度 。 


15.9 函数 式 语言 的 应 用 


在 过 去 45 年 间 ， 高 级 程序 设计 语言 的 历史 中 ， 只 有 少数 的 函数 式 语 言 得 到 了 广泛 的 应 用 。 
其 中 最 为 显著 的 是 LISP 语 言 。 

LISP 是 一 种 通用 且 功 能 强大 的 语言 。 在 最 初 的 15 年 中 ， 那 些 不 使 用 LISP 的 人 们 认为 它 是 
一 种 使 用 代价 非常 昂贵 的 陌生 语言 。 的 确 ， 在 20 世 纪 60 年 代 和 20 世 纪 70 年 代 的 早期 ， 人 们 通 
第 认为 只 有 两 个 种 类 的 语言 ， 一 个 种 类 包括 LISP 语 言 ， 而 另 一 个 种 类 包括 所 有 其 他 的 程序 设 
计 语 言 。 

LISP 是 为 了 人 工 智能 中 的 符号 计算 以 及 表 处 理应 用 而 开发 的 。 在 许多 人 工 智 能 应 用 中 ， 
LISP 以 及 从 它 所 派生 出 来 的 语言 仍然 是 标准 的 语言 。 

在 人 工 智能 之 中 ， 许 多 领域 主要 都 是 通过 LISP 的 使 用 来 发 展 的 。 虽 然 也 使 用 了 其 他 类 型 的 
语言 ， 主 要 是 逻辑 程序 设计 语言 ， 但 是 大 部 分 已 有 的 专家 系统 都 是 用 LISP 开发 的 。LISP 也 在 
知识 表示 、 机 器 学 习 、 管 能 训练 系统 和 语音 和 视觉 的 建 模 中 占有 支配 性 的 地 位 。 

LISP 在 人 工 智能 以 外 的 一 些 应 用 也 是 成 功 的 。 例 如 ，Emacs 文 本 编辑 程序 、 用 作 符 号 微 积 


O 此 例 出 现在 Hughes (1989), 


DARRA ATTE 455 





分 的 符号 数学 系统 MACSYMA 等 等 ， 都 是 使 用 LISP 编 写 的 。LISP 机 器 是 一 种 个 人 计算 机 ， 它 的 
整个 系统 软件 都 是 使 用 LISP 编 写 的 。LISP 还 在 许多 应 用 领域 里 被 成 功 地 用 来 开发 实验 系统 。 

Scheme 广 泛 用 于 函数 式 程序 设计 的 教学 。 它 也 在 一 些 大 学 中 用 于 程序 设计 入 门 课程 的 教学 。 
对 ML 和 Haskell 的 使 用 ， 大 致 上 仅 限 于 研究 实验 室 和 大 学 。 


15.10 函数 式 语言 和 命令 式 语 言 的 比较 


函数 式 语 言 能 够 具有 非常 简单 的 语法 结构 。LISP 就 是 其 中 的 一 个 例子 ， 它 的 链表 结构 既 可 
以 用 来 组 织 代码 ， 也 可 以 用 于 数据 。 命 令 式 语言 的 语法 要 复杂 得 多 。 

与 命令 式 语言 的 语义 相 比 ， 函 数 式 语言 的 语义 也 是 简单 的 。 例 如 ， 在 对 3.5.3 市 中 的 循环 结 
构 进行 标志 语义 的 描述 时 ， 循 环 从 迭代 转换 成 为 了 递归 。 在 一 种 纯粹 函数 式 的 语言 中 ， 这 样 的 
转换 就 不 需要 。 函 数 式 语 言 中 没有 友 代 。 另 外 在 第 3 章 中 ， 我 们 曾经 假设 这 一 章 中 命令 式 结构 的 
标志 语义 描述 不 具有 表达 式 的 副作用 。 所 有 基于 C 的 语言 都 具有 表达 式 副 作用 ， 因 而 上 面 的 这 
种 限制 是 不 现实 的 。 然 而 ， 纯 函数 式 语言 的 标志 语义 摘 述 就 不 需要 这 样 的 限制 。 

函数 式 程序 设计 社区 的 一 些 人 声称 ， 使 用 函数 式 程序 设计 会 引起 开发 效率 呈 数 量 级 增长 ， 
这 主要 是 由 于 函数 式 程序 的 大 小 只 有 命令 式 语言 程序 大 小 的 10%。 解 决 一 些 问题 时 会 达到 这 个 
比例 ， 而 解决 有 一 些 可 能 会 达到 用 命令 式 语言 编写 的 程序 大 小 的 25% 左 右 (Wadler, 1998), ix 
些 因 素 让 函数 式 程序 设计 的 拥护 者 声称 它 的 开发 效率 是 使 用 命令 式 程序 设计 语言 的 4~10 倍 。 然 
m, 单单 只 用 程序 的 大 小 并 不 是 好 的 测量 开发 效率 的 因素 。 当 然 ， 并 不 是 每 一 行 源 代码 都 有 相 
同 的 复杂 度 ， 他 们 也 不 会 花 相 同 的 时 间 在 每 一 行 代码 上 。 实 际 上 ， 由 于 处 理 变量 的 必要 性 ， 命 
令 式 程序 用 很 多 行 代码 来 进行 初始 化 和 轻微 地 改动 变量 。 

执行 效率 是 它们 的 男 一 个 可 比较 之 处 。 当 解释 函数 式 程序 时 ， 它 们 当然 比 编译 好 的 命令 式 
程序 慢 。 然 而 ， 现 在 有 一 些 专门 为 国 数 式 语 言 设 计 的 编译 器 ， 这 使 国 数 式 程序 和 命令 式 程序 运 
行 速度 的 差异 不 再 那么 显著 。 有 人 可 能 会 说 ， 因 为 函数 式 程序 明显 比 对 应 的 命令 式 程序 小 ， 所 
以 它们 应 该 执行 得 更 快 。 然 而 ， 事 情 和 常常 不 是 这 样 的 ， 因 为 函数 式 语言 的 一 些 语言 特征 对 执行 
效率 有 很 大 的 负面 影响 。 考 虑 函数 式 程序 和 命令 式 程序 的 相对 效率 ， 一 般 的 函数 式 程序 的 执行 
时 间 是 其 对 应 的 命令 式 程序 的 2 倍 (Wadler, 1998) ， 这 是 合理 的 估计 。 这 听 起 来 令 人 感到 这 异 ， 
对 于 一 个 给 定 的 项 目 ， 这 个 因素 常常 让 人 们 放弃 使 用 函数 式 语言 。 然 后 ， 两 个 因素 的 不 同 只 有 
在 严格 要 求 执 行 速度 的 情况 下 才 是 重要 的 。 有 许多 情形 下 并 不 要 求 有 很 严格 的 执行 速度 。 例 如 ， 
考虑 许多 用 命令 式 语 言 编 写 的 程序 ， 如 用 JavaScript 和 PHP 编 写 的 Web 软 件 以 及 Java 小 程序 ， 它 
们 都 比 对 应 的 编译 版 本 慢 。 但 对 这 些 应 用 程序 ， 执 行 速度 并 不 是 最 优先 考虑 的 事 。 

函数 式 语言 的 男 一 个 六 在 的 优点 是 可 读 性 好 。 在 许多 命令 式 程序 中 ， 对 变量 细节 的 处 理 把 
程序 逻辑 弄 得 难以 理解 了 。 考 虑 一 个 计算 正 整 数 n 的 立方 和 的 函数 。 用 C 语 言 编写 如 下 : 

int sum cubes(int n){ 

int sum = 0; 
for(int index = 1; index <= n; index++) 
sum += index * index * index; 


return sum; 


} 
而 用 Haskell 编 写 如 下 : 


sumCubes n = sum (map (“3) [1..n]) 


这 种 版 本 简单 地 指定 了 3 个 步骤 : 
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1) 构建 数列 [1...n])。 

2) 通过 映射 计算 三 次 方 的 函数 到 数列 中 的 每 个 数 来 创建 新 数列 。 

3) 对 新 数列 求 和 。 

因为 缺乏 变量 和 迭代 控制 的 细节 ， 所 以 这 个 版 本 比 C 版 本 具有 更 好 的 可 读 性 。 

命令 式 语言 的 并 发 执行 很 难 设计 ， 也 很 难 使 用 。 例 如 ， 考 虑 Ada 的 任务 模型 ， 它 的 并 发 任 
务 的 协作 由 程序 设计 人 员 负 责 。 首 先 ， 我们 通过 把 函数 式 程序 转化 为 图 来 执行 它们 。 然 后 通过 
图 减 化 过 程 来 执行 这 些 图 ， 这 样 能 处 理 许多 程序 设计 人 员 来 指定 的 并 发 。 图 表示 自然 地 为 并 发 
执行 提供 了 机 会 。 在 这 个 过 程 中 的 协作 同步 不 是 程序 设计 人 员 考 虑 的 内 容 。 此 过 程 的 细节 描述 
超出 了 本 书 讲述 的 范畴 。 

在 一 种 命令 式 语言 中 ， 程 序 员 必 须 静态 地 将 程序 分 成 它 的 并 发 部 分 ， 然 后 将 这 些 并 发 部 分 
网 写成 任务 。 这 可 能 是 一 个 复杂 的 过 程 。 函 数 式 语 言 中 的 程序 能 够 被 执行 系统 动态 地 分 成 并 发 
部 分 ， 这 使 得 程序 能 够 极 大 程度 地 适应 于 所 运行 的 硬件 。 在 命令 式 语言 中 理解 并 发 程序 则 要 困 
难得 多 。 

要 准确 地 弄 清 楚 为 什么 函数 式 语言 没有 得 到 流行 不 是 一 件 简 单 的 事 。 很 显然 ， 早 期 实现 的 
低 效 性 是 一 个 因素 并且 非常 有 可 能 的 是 ， 至 少 有 一 些 当 前 命令 式 程序 设计 人 员 相 信用 函数 式 
语言 编写 的 程序 运行 仍然 很 慢 。 此 外 ， 大 量 的 程序 设计 人 员 是 从 命令 式 语言 开始 的 ， 这 使 他 们 
觉得 函数 式 程序 很 奇怪 ， 而 且 难以 理解 。 对 于 许多 习惯 于 命令 式 程序 设计 的 人 ， 切 换 到 函数 式 
程序 设计 是 一 件 没 有 吸引 力 的 、 潜 在 上 很 困难 的 事 。 另 一 方面 ， 从 函数 式 语言 开始 的 那些 人 从 
来 不 会 注意 到 函数 式 程序 的 奇异 之 处 。 

显 而 多 见地 ， 那 些 命令 式 程序 设计 人 员 相 信 ， 因 为 他 们 都 自由 自在 地 使 用 命令 式 语言 进行 
程序 设计 ， 所 以 命令 式 程序 设计 实际 上 是 一 种 更 自然 的 程序 设计 方式 。 一 些 函 数 式 程序 设计 人 
中 也 是 这 样 看 待 函数 式 程序 的 。 当 然 ， 没 有 人 发 现 有 一 种 好 的 方式 来 衡量 “自然 "。 最 后 ， 函 数 
式 程序 设计 接近 于 数学 ， 这 虽然 导致 了 函数 式 语言 的 准确 和 雅致， 但 事实 上 ， 却 使 许多 程序 设 
WAR (特别 是 那些 不 擅长 数学 的 人 ) 不 那么 容易 使 用 函数 式 程序 设计 语言 。 


小 结 


数学 函数 是 一 些 命名 的 或 无 名 的 映射 ， 它们 仅仅 使 用 条 件 表示 式 和 递归 来 控制 它们 的 计算 。 能 够 通 
过 函数 形式 来 构造 复杂 的 函数 ， 在 其 中 将 函数 用 作 参 数 、 返回 值 或 将 函数 既 用 作 参 数 又 用 作 返 回 值 。 

国 数 式 程序 设计 语言 是 基于 数学 函数 的 。 第 函 数 式 语言 不 使 用 变量 或 赋值 语句 产生 结果 ， 它 们 使 用 
国 数 的 应 用 、 条 件 表示 式 和 递归 来 作为 执行 的 控制 ， 并 且 使 用 函数 形式 来 构造 复杂 的 函数 。LISP 在 初始 时 
息 纯 函数 式 语言 ， 但 是 很 快 便 具 有 了 许多 命令 式 语言 特性 ， 以 增加 语言 的 效率 和 易 用 性 。 

LISP 的 第 一 个 版 本 产生 于 人 工 智能 应 用 中 对 表 处 理 语言 的 需要 。 LISP 仍 然 是 这 个 领域 里 最 为 广泛 应 
用 的 语言 。 

LISP 的 第 一 种 实现 是 偶然 出 现 的 : EVAL 的 最 初版 本 只 是 开发 来 展示 编写 通用 的 LISP 函 数 的 可 能 性 的 . 

因为 LISP 的 数据 和 LISP 的 程序 具有 相同 的 形式 ， 我 们 可 以 使 用 一 个 程序 来 建立 另外 的 一 个 程序 。 
EVAL 人 允许 立刻 执行 这 样 的 程序 。 

Scheme 十 LISP 的 一 个 相对 简单 的 方言 ， 它 仅仅 使 用 静态 作用 域 。 像 LISP 一 样 ， Scheme 中 的 主要 原 
始 国 数 包 括 用 于 构造 或 拆散 链表 的 函数 、 用 于 条 件 表示 式 的 函数 以 及 用 于 数字 、 符 号 和 链表 的 简单 谓词 
函数 。Scheme 还 包括 一 些 命令 式 操作 ， 例 如 ， 改 变 给 定 链表 中 的 一 个 元 素 。 

COMMON LISP 是 一 种 基于 LISP 的 大 型 语言 ， 它 被 设计 来 包括 20 世 纪 80 年 代 初期 的 各 种 LISP 方 言 中 
的 大 部 分 特性 。 它 允许 静态 作用 域 和 动态 作用 域 的 变量 ， 并 且 包 括 了 许多 命令 式 的 特性 。 

ML 是 一 种 静态 作用 域 的 强 类 型 函数 式 程序 设计 语言 它 的 语法 则 更 类 似 于 命令 式 语言 ， 而 不 是 类 似 


于 LISP 语 言 。ML 包 括 了 类 型 推理 系统 、 异常 处 理 、 数 据 结 构 和 抽象 数据 类 型 。 

Haskell 与 ML 相 类 似 。Haskell 中 的 所 有 表达 式 都 使 用 一 种 懒惰 方式 来 求 值 。 这 就 允许 程序 来 处 理 无 穷 
链表 。Haskell 所 支持 的 链表 综合 提供 了 一 种 方便 而 熟悉 的 语法 来 描述 集合 。 

虽然 LISP 的 主要 应 用 领域 是 人 工 智 能 ， 但 是 它 也 成 功 地 应 用 于 许多 不 同 的 问题 领域 。 

虽然 在 有 些 方面 ， 纯 函数 式 语 言 优 于 命令 式 语 言 ， 但 是 函数 式 语 言 在 汉 ' 诺 依 曼 机 器 上 执行 的 低 效 
率 阻碍 了 它们 的 应 用 。 


文献 注释 


McCarthy (1960) 发 布 第 一 种 公开 发 行 的 LISP 版 本 。 从 20 世 纪 60 年 代 的 中 期 ， 到 20 世 纪 70 年 代 的 后 
期 所 广泛 使 用 的 版 本 ，McCarthy et al.(1965) 和 Weissman (1967) 对 其 进行 了 描述 。Steele (1984) 对 于 
COMMON LISP 进 行 了 描述 。Rees 和 Clinger (1986) 讨论 了 Scheme 语言 以 及 它 的 一 些 改进 和 优点 。 
Dybvig (2003) 写 了 一 本 获取 Scheme 程序 设计 信息 的 好 书 。Milner et al. (1990) 给 出 了 ML 的 定义 。 
Ullman (1998) 写 了 一 本 关于 ML 的 很 好 的 介绍 性 的 教科 书 。Thompson (1996) 介绍 了 Haskell 程 序 设计 。 
Henderson (1980) 作 了 关于 函数 式 程序 设计 的 严格 讨论 。 通 过 图 归 约 实现 函数 式 语言 的 过 程 ， 
Peyton Jones (1987) 对 其 进行 了 详细 的 讨论 。 
复习 题 
1. 定义 函数 形式 和 引用 透明 性 。 
2. 什么 数据 类 型 是 最 初始 LISP 语 言 中 的 一 部 分 ? 
3. EQ?，EQV? 和 = 之 间 的 区 别 是 什么 ? 
4. 用 于 Scheme 特殊 形式 DEFINE 的 求 值 方法 ， 与 用 于 Scheme 原始 函数 的 求 值 方法 之 间 ， 有 什么 不 同 ? 
5. DEFINE 有 哪 两 种 形式 ? 
6. 描述 COND 的 语法 和 语义 。 
7. 描 述 ZET 的 语法 和 语义 。 
8. 为 什么 将 命令 式 特性 附加 到 LISP 的 大 多 数 方言 之 中 ? 
9. COMMON LISP 与 Scheme 在 哪些 方面 是 相反 的 ? 
10. 在 Scheme 中 使 用 什么 样 的 作用 域 规则 ? 在 COMMON LISP 中 呢 ? 在 ML 中 呢 ? 在 Haskell 中 呢 ? 
11. 在 哪 三 个 方面 ML 非常 不 同 于 Scheme? 
12. ML 中 所 用 的 类 型 推理 是 什么 ? (参见 第 5 章 ) 
13. Haskell 中 使 得 它 非常 不 同 于 Scheme 的 三 种 特性 是 什么 ? 
14. 懒惰 求 值 意味 着 什么 ? 
15. CONS、LIST 和 APPEND 有 什么 不 同 ? 


练习 题 


1. 阅读 John Backus 关 于 FP 的 文章 (Backus, 1978), 并 且 将 在 本 章 中 讨论 过 的 Scheme 的 特性 与 FP 的 对 应 
特性 进行 比较 。 

2. 找 出 Scheme 函 数 EVALLA 及 APPLY 的 定义 ， 并 且 解 释 这 两 种 函数 的 行为 。 

3. Teitelmen 和 Masinter 的 文章 “The INTERLISP Programming Environment” (IEEE Computer, Vol. 14, 
No. 4, April 1981) 中 描述 到 ， 对 于 任何 语言 最 现代 和 最 完整 的 程序 设计 环境 之 一 是 LISP 的 
INIERLISP 系 统 。 仔 细 阅 读 这 篇 文章 ， 并 且 针 对 使 用 你 的 系统 来 编写 LISP 程 序 的 难度 与 使 用 
INTERLISP 来 编写 LISP 程 序 的 难度 进行 比较 。( 假 设 你 通常 并 不 使 用 INTERLISP 系 统 ,) 

4. 参考 一 本 关于 LISP 程 序 设计 的 书 ， 确 定 什么 是 支持 在 LISP 中 包括 PRoG 特 性 的 原因 。 

5. 一 种 函数 式 .语言 可 以 使 用 链表 以 外 的 一 些 数据 结构 。 例 如 ， 它 可 以 使 用 符号 序列 。 如 果 有 这 样 一 种 话 
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言 ， 需 要 用 什么 样 的 原始 函数 来 代替 Scheme 的 原始 函数 CAR、CDR 和 CONS? 
6. 下 面 的 Scheme 函 数 做 些 什 么 ? 
(define (y s lis) 
(cond 

({null? lis) "() ) 
((equal? s (car lis)) lis) 
(else (y s (cdr lis))) 

)) 


7. 下 面 的 Scheme 函数 做 些 什么 ? 


(define (x lis) 
(cond 
((null? lis) 0) 
((not (list? (car lis))) 
(cond 

((eq? (car lis) nil) (x (cdr lis))) 
(else, (+ 1 (æ (cdr lis)))):)) 

(else (+ (x (car lis)) (x (cdr lis)))) 


)) 


程序 设计 练习 题 


1. 编写 一 个 Scheme 函数， 计算 一 个 球 性 的 体积 ， 球 半 经 是 给 定 的 。 

2. 编写 一 个 Scheme 函数， 计算 一 个 给 定 二 次 方程 式 的 实数 根 。 如 果 所 计算 的 根 为 复数 ， 这 个 函数 还 必须 显 
示 一 种 指示 复数 的 方法 。 这 个 函数 必须 使 用 王 函 数 。 而 函数 的 三 个 参数 ， 就 是 这 个 二 次 方程 的 三 个 系数 。 

3. 重复 程序 设计 练习 题 2， 但 是 使 用 COND 函 数 ， 而 不 是 使 用 IF 函 数 。 

4. 编写 一 个 Sctheme 函 数 ， 这 个 函数 从 给 定 的 简单 数字 链表 中 返回 数字 0。 

5. 编写 一 个 Sctheme 函 数 ， 这 个 函数 将 找 出 给 定 链表 中 给 定 原子 的 所 有 顶层 实例 。 

6. 编写 一 个 Sctheme 函 数 ， 这 个 函数 将 给 定 的 链表 中 的 最 后 一 个 元 素 移 出 来 。 . 

7. 重复 程序 设计 练习 题 5， 除 了 其 中 的 原子 或 者 是 一 个 原子 ， 或 者 是 一 个 链表 之 外 。 

8. 编 写 一 个 Scheme 函 数 ， 它 具有 三 个 参数 : 其 中 的 两 个 是 原子 ， 一 个 是 链表 ， 这 个 函数 将 链表 中 所 出 现 
的 所 有 第 一 个 给 定 的 原子 都 替换 成 第 二 个 给 定 的 原子 ， 而 不 论 第 一 个 给 定 的 原子 在 链表 中 被 嵌 套 的 层 
次 有 多 次 。 

9. 编写 一 个 Scheme 函数 来 反 序 排列 它 的 简单 链表 中 的 参数 。 

10. 编写 一 个 Scheme 谓词 函数 ， 来 测试 两 个 给 定 链表 在 结构 上 的 相等 性 。 两 个 被 称 为 结构 相等 的 链表 具有 
相同 的 链表 结构 ， 虽 然 在 这 两 个 链表 中 的 原子 可 以 是 不 同 的 。 

11. 编写 一 个 Scheme 函数 ， 它 返回 两 个 表示 集合 的 简单 链表 参数 的 并 。 

12. 编写 一 个 Scheme 国 数 ， 它 具有 两 个 参数 : 其 中 的 一 个 是 原子 ， 一 个 是 链表 。 这 个 函数 从 链表 中 将 给 定 
原子 的 所 有 出 现 都 删除 掉 ， 而 不 论 它们 出 现在 链表 中 的 位 置 多 深 ， 并 返回 删除 之 后 的 链表 。 所 返回 的 
链表 在 删除 了 原子 的 位 置 上 ， 不 能 够 放置 任何 其 他 的 元 素 。 

13. 编写 一 个 Scheme 函 数 ， 它 取 一 个 链表 作为 参数 ， 并 且 删 除 掉 链 表 顶 层 的 第 二 个 元 素 ， 然 后 返回 新 的 链 
表 。 如 果 所 给 定 的 链表 没有 二 个 元 素 ， 这 个 函数 将 返回 ()。 

14. 饥 写 一 个 Scheme 函数 ， 它 取 一 个 简单 数字 链表 作为 参数 ， 这 个 函数 将 链表 中 的 元 素 按 从 小 到 大 的 顺序 
重新 排列 ， 返 回 这 个 重新 排序 之 后 的 链表 。 

15. 独 写 一 个 Scheme 函 数 ， 它 取 一 个 简单 数字 链表 作为 参数 ， 返 回 这 个 链表 中 景 大 的 和 最 小 的 数字 

16. 编写 一 个 Scheme 函 数 ， 它 取 一 个 简单 链表 作为 参数 ， 这 个 函数 将 给 定 链表 中 的 元 素 全 部 重新 相互 错位 
排列 ， 返 回 这 个 重新 排列 之 后 的 链表 。 
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第 16 章 ”逻辑 程序 设计 语言 
这 一 章 的 目的 是 介绍 逻辑 程序 设计 的 概念 以 及 逻辑 程序 设计 语言 ， 还 包括 对 于 Prolog 子 集 
的 简短 描述 。 谓 词 演算 是 逻辑 程序 设计 语言 的 基础 ， 因 而 我 们 将 首先 介绍 谓词 演算 。 接 着 ， 
我 们 讨论 如 何 将 谓词 演算 用 于 自动 定理 证 明 的 系统 。 然 后 是 关于 逻辑 程序 设计 的 一 般 概 述 ， 
再 接 下 来 ,使 用 了 较 长 的 一 节 来 介绍 Prolog 程 序 设计 语言 的 基础 ， 其 中 包括 算术 运算 、 表 处 理 
和 一 个 追踪 工具 的 用 法 ， 这 个 工具 可 以 帮助 调试 程序 ， 并 且说 明 Prolog 系 统 的 工作 机 制 。 最 后 

两 广 描 述 Prolog 作 为 罗 辑 语言 的 一 些 问题 ， 以 及 Prolog 语 言 的 一 些 应 用 领域 . 


16.1 概述 


第 15 章 讨论 了 函数 式 程序 设计 技术 ， 函 数 式 程序 设计 与 命令 式 语 言 一 起 使 用 的 软件 开发 
方法 学 有 显著 的 不 同 。 在 本 章 中 ， 我 们 将 描述 另外 一 种 不 同 的 程序 设计 方法 学 。 这 种 方法 使 
用 付 号 边 辑 来 表示 程序 ， 并 且 使 用 逻辑 推理 过 程 来 产生 结果 。 逻 辑 程序 是 说 明 性 的 ， 而 不 是 
过 程 性 的 ， 这 就 意味 着 仅仅 是 说 明 所 需要 的 结果 ， 而 不 必 说 明 产 生 这 个 结果 的 详细 过 程 。 

将 茶 种 形式 的 符号 逻辑 ， 用 作 程序 设计 语言 的 程序 设计 ， 通 常 被 称 为 逻辑 程序 设计 ， 而 
基于 符号 逻辑 的 语言 ， 则 被 称 为 逻辑 程序 设计 语言 或 说 明 性 语言 。 因 为 涩 辑 程序 设计 语言 
Prolog 是 唯一 广泛 使 用 的 逻辑 语言 ， 所 以 我 们 在 这 一 章 仅 描述 这 一 种 语言 。 

这 辑 程序 设计 语言 的 语法 明显 地 不 同 于 命令 式 语言 和 函数 式 语 言 的 语法 。 逻 辑 程序 的 语 
你 也 与 命令 式 语言 程序 的 语义 极 少 相似 之 处 。 这 些 观察 会 让 读者 对 逻辑 程序 设计 和 说 明 性 语 
言 的 性 质 产 生 一 些 好 奇 心 。 


16.2 谓词 演算 的 简短 介绍 


在 我 们 讨论 逻辑 程序 设计 之 前 ， 必 须 先 简略 地 介绍 这 种 语言 的 基础 ， 即 形式 四 辑 ， 这 
不 征 我 们 第 一 次 在 这 本 书 中 接触 形式 逻辑 ， 在 第 3 章 中 ， 曾 经 大 量 使 用 形式 逻辑 来 描述 公理 
FX. 

MRA (proposition) 可 以 被 认为 是 一 种 逻辑 陈述 ， 它 可 能 为 真 也 可 能 为 假 。 命 题 由 对 象 和 
对 象 间 的 关系 所 组 成 。 形 式 罗 辑 被 开发 来 提供 描述 命题 的 一 种 方法 ， 其 目的 是 为 了 确定 这 些 
形式 陈述 的 命题 之 真 假 。 

符号 逻辑 (symbolic logic) 可 以 被 用 于 形式 罗 辑 中 的 三 种 基本 需要 ;表示 命题 、 表 达 合 
题 之 间 的 关系 ， 以 及 描述 怎样 从 设 定 为 真 的 其 他 命题 推理 出 新 的 命题 

形式 逻辑 和 数学 之 间 有 着 紧密 的 关系 。 事 实 上 ， 许 多 数学 问题 都 能 够 以 逻辑 的 方式 来 进 
行 思 学。 数 和 集合 论 的 基本 公理 ， 是 基本 命题 的 集合 ， 这 些 命题 被 设 定 为 真 。 定 理 ， 则 是 从 
基本 命题 集合 所 推断 出 的 一 些 附 加 的 命题 。 

用 于 巡 辑 程序 设计 的 符号 逻辑 的 特殊 形式 ， 被 称 为 一 阶 谓词 演算 (first-order predicate 
calculu)。 我 们 通常 称 之 为 阶 谓词 演算 , 虽然 这 种 称 法 并 不 十 分 准确 。 在 本 节 以 下 部 分 ， 我 们 
将 向 略 地 描述 谓词 演算 。 我 们 的 目的 ， 是 为 逻辑 程序 设计 和 罗 辑 程序 设计 语言 Prolog 的 讨论 ， 
提供 一 种 基础 。 
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16.2.1 命题 


逻辑 程序 设计 命题 中 的 对 象 ， 被 表示 为 简单 的 项 ， 一 个 项 可 以 是 常量 或 变量 。 常 量 , 是 
表示 对 象 的 符号 。 变 量 ， 是 在 不 同时 间 能 表示 不 同 对 象 的 符号 ， 这 里 的 变量 ， 在 数学 变量 与 
命令 式 程 序 设计 语言 变量 之 间 ， 更 接近 于 数学 变量 。 

最 简单 的 命题 ， 被 称 为 原子 命题 (atomic proposition) ， 它 由 复合 项 所 组 成 。 复 合 项 
(compound term) ， 是 数学 关系 的 一 种 元 素 ， 数 学 关系 的 外 观 ， 与 数学 函数 的 表示 方法 相同 。 
回忆 曾经 在 第 15 章 中 讨论 过 的 ， 一 个 数学 函数 就 是 一 种 映射 ， 可 以 将 它 表 示 为 一 个 表达 式 或 
者 是 元 组 的 表格 。 复 合 项 就 是 函数 表格 定义 中 的 元 素 。 

复合 项 由 两 个 部 分 所 组 成 : 函数 符 和 一 组 有 序 的 参数 。 国 数 符 是 命名 关系 的 函数 符号 。 
只 有 一 个 参数 的 复合 项 ， 是 一 元 组 ;具有 两 个 参数 的 则 是 二 元 组 ， 等 等 。 例 如 ， 我 们 可 以 有 
两 个 命题 : 

man(jake) 

like(bob, steak) 

这 两 个 命题 说 明 ，{jake} 是 被 命名 为 man (HA) 的 关系 中 的 一 个 一 元 组 ;而 {bob， 
steak}， 是 被 命名 为 like (喜欢 或 者 类 似 ) 的 关系 中 的 一 个 二 元 组 。 如 果 我 们 将 命题 


man (fred) 


加 入 到 上 面 的 那 两 个 命题 ， 那 么 关系 man 就 具有 了 两 个 不 同 的 元 素 ， 即 {jake} 和 {fred}, 
在 这 些 命题 里 的 所 有 简单 项 ，(man、jake、like、bob 和 steak) 都 是 常量 。 注 意 ， 这 些 命题 并 
没有 固有 的 语义 。 我 们 希望 它们 具有 什么 样 的 意义 ， 它 们 就 可 以 具有 什么 意义 。 例 如 ， 上 面 
第 二 个 例子 的 意义 ， 可 能 是 bob 喜 欢 (like) 牛排 (steak), ， 也 可 以 是 牛排 (steak) 喜欢 (like) 
bob ， 或 者 是 bob 在 某 些 方面 与 牛排 (steak) 相 类 似 (like), 

命题 能 够 在 两 种 模式 中 来 描述 ， 在 第 一 种 模式 中 ， 命 题 被 定义 为 真 ， 而 在 第 二 种 模式 中 ， 
命题 的 真 值 尚 竺 确定 。 换 名 话说， 能 够 将 命题 陈述 为 事实 或 是 查询 。 上 面 所 示例 的 命题 ， 就 
可 能 是 事实 或 查询 。 

复合 命题 有 两 个 或 多 个 由 逻辑 连接 符 或 操作 符 连接 的 原子 命题 ， 连 接 的 方式 与 命令 式 话 
言 中 构造 复合 逻辑 表达 式 的 相同 。 下 面 是 谓词 演算 逻辑 连接 符 的 名 字 、 符 号 和 意义 : 


名 字 符号 示例 意义 
非 7 74 {Fa 
合 取 N afb ajb 
析 取 U aUb a 或 b 
等 价 = a=b a 等 价 于 b 
zea ih > aab až Wb 
= agh b 强 涵 a 
下 面 是 复合 命题 的 例子 : 
afib Se 
afl-bod 


操作 符 - 具 有 最 高 的 优先 级 高 于 。 操 作 符 门 、U 和 三 ， 都 具有 高 于 二 和 己 的 优先 级 。 因 
此 ， 上 面 的 第 二 个 例子 等 价 于 
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(a. (nb) >a 

变量 可 以 出 现在 命题 中 ， 但 仅 当 由 被 称 为 限定 符 的 特殊 符号 所 引入 的 条 件 之 下 。 谓 词 
演算 包括 了 两 种 限定 符 ， 如 在 下 面 的 描述 中 所 介绍 的 ， 在 这 里 ，X 是 一 个 变量 ， 而 P 是 一 个 
命题 : 


名 字 示例 意义 
全 称 限定 符 YXP 对 于 所 有 的 X，P 都 为 真 . 
存在 限定 符 JX.P 存在 着 X 的 一 个 值 ， 使 得 B 为 真 . 


在 X 和 P 之 间 的 点 ， 只 是 用 来 将 变量 与 命题 分 隔 开 。 例 如 ， 考 虑 下 面 命题 
VX.(woman (X) Dhuman(X)) 
4X.(mother (mary, X) N man (X)) 


第 一 个 命题 的 意思 是 ， 对 于 X 的 任何 值 ， 如 果 X 是 一 个 woman (女人 )， 那 么 X 是 一 个 human 
(人 )。 第 二 个 命题 的 意思 是 ， 存 在 着 X 的 一 个 值 ， 以 至 于 mary 是 X 的 mother (43%), HAXE 
一 个 man (男人 )， 换 旬 话 说 ， 也 即 mary 有 一 个 儿子 。 全 称 限定 符 和 存在 限定 符 的 作用 域 ， 就 
征 它 们 所 属 的 原子 命题 。 正 如 在 上 面 所 描述 的 这 两 个 复合 命题 中 ， 我 们 也 可 以 使 用 圆 括号 来 将 
这 个 作用 域 施行 扩展 。 全 称 限定 符 和 存在 限定 符 ， 具有 比 其 他 任何 操作 符 都 更 高 的 优先 级 。 
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16.2.2 子 句 形式 


我 们 之 所 以 讨论 谓词 演算 ， 是 因为 它 是 逻辑 程序 设计 语言 的 基础 。 同 其 他 的 语言 一 样 ， 
形 却 最 简单 的 逻辑 语言 最 好 ， 这 意味 着 应 该 将 宛 余 减少 到 最 低 的 限度 。 

到 目前 为 止 我 们 所 描述 的 谓词 演算 的 一 个 问题 ， 就 有 着 许多 不 相同 的 方式 ， 来 描述 同样 
含义 的 命题 ， 也 就 是 说 ， 有 很 多 的 元 余 。 这 对 于 逻辑 学 家 还 不 是 太 大 的 问题 ， 但 是 如 果 要 将 
谓词 演算 用 在 一 个 自动 化 (计算 机 化 的 ) 系统 之 中 ， 这 将 会 是 一 个 严重 的 问题 。 因 而 我 们 需 
要 一 种 谓词 的 标准 形式 ， 以 便 将 事情 简单 化 。 一 种 相对 简单 的 命题 形式 ， 子 名 形式， 恰好 就 
古 这 样 的 一 种 标准 形式 。 可 以 将 所 有 的 命题 都 用 子 名 形式 来 表达 ， 而 不 会 失去 其 通用 性 。_- 
个 子 名 形式 的 命题 ， 具 有 下 面 的 通用 语法 : 

BiUBU…UBc4n4n…na4， 


这 里 的 4 和 8 是 项 。 这 个 子 名 形式 的 命题 意义 为 : 如果 所 有 的 A 都 为 真 ， 那 么 就 至 少 存 在 着 一 
个 6 为 真 。 子 句 形式 命题 的 主要 特性 是 : 不 需要 存在 限定 符 ， 对 于 原子 命题 中 的 变量 使 用 ， 会 
称 限 定 符 是 隐 性 的 ， 不 需要 合 取 和 析 取 之 外 的 任何 操作 符 。 并 且 ， 合 取 和 析 取 只 能 以 通用 子 
名 形式 中 的 次 序 出 现 : 析 取 出 现在 左边 ， 合 取出 现在 右边 。 所 有 的 谓词 演算 命题 ， 都 能 够 通 
过 算法 变换 到 子 名 形式。Nilsson (1971) 曾经 证 明了 这 是 能 够 做 到 的 ， 并 且 还 存在 着 一 种 简 
单 的 变换 算法 。 

将 子 句 形式 命题 的 右边 称 为 前 件 (antecedent), ， 而 将 左边 称 为 后 件 (consequent) ， 它 是 
前 件 为 真 时 的 结果 。 作 为 子 句 形式 命题 的 例子 ， 考 虑 下 面 的 例子 ; 

likes(bob, trout) Clikes(bob, fish) N fish(trout) 

father(louis, al) U father(louis, violet) c father(al, bob) [| mother(violet, bob) 

N grandfather(louis, bob) 


在 英文 的 版 本 中 ， 上 面 第 一 条 命题 所 描述 的 意思 是 ， 如 果 bob 喜 欢 鱼 ， 并 且 鳞 鱼 是 鱼 ， 那 
A bobs ht, HRT GPR RB: 如果 al 是 bob 的 父亲 ， violet 是 bob 的 母亲 ， 并 且 
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louis 是 bob 的 祖父 ， 那 么 ，louis 如 果 不 是 al 的 父亲 ， 就 会 是 violet 的 父亲 。 
16.3 谓词 演算 与 定理 证 明 


谓词 演算 ， 提 供 了 一 种 表达 一 组 命题 的 方法 。 一 组 命题 ， 可 以 用 来 确定 是 否 能 从 它们 推 
理 出 任何 有 趣 或 是 有 用 的 事实 。 这 与 数学 家 们 的 工作 完全 是 类 似 的 。 数 学 家 们 试图 发 现 是 否 
能 够 从 已 知 的 公理 和 定理 ， 推 新 出 新 的 定理 来 。 | 

在 计算 机 科学 的 早期 (20 世纪 50 年 代 和 60 年 代 的 初期 )， 人 们 对 于 定理 证 明 过 程 的 自动 化 ， 
有 着 极 大 的 兴趣 。 在 自动 定理 证 明 中 最 重要 的 突破 之 一 ， 是 Syracuse 大 学 的 Alan Robinson 所 
发 现 的 归结 原理 (Robinson, 1965), 

归结 (resolution) 是 一 条 推理 规则 ， 它 允许 从 给 定 的 命题 中 ， 计 算出 推理 的 命题 。 这 样 
就 提供 了 一 种 在 自动 定理 证 明 中 ， 具 有 潜在 应 用 的 方法 。 归 结 被 设计 来 应 用 于 子 句 形式 命题 。 
归结 的 概念 介绍 如 下 ,假设 有 下 面 形 式 的 两 个 命题 : 

Pps 

Q: cQ; 

ENE LA, P-P, HEOR. WR RRRA, RAIT 
将 P/ 和 0Q, 重 新 命名 为 T。 那 么 ， 我 们 可 以 这 样 来 重新 编写 上 面 的 两 个 命题 . 


Cr, 

Q,cT 

现在 ， 因 为 P, 强 涵 T， 并 且 7 蕴 涵 0,， 逻 辑 上 很 明显 : PARO, 
QO, cP, 


从 原 有 的 两 个 命题 ， 推 断 出 上 面 这 个 命题 的 过 程 ， 就 是 归结 。 
作为 男 外 的 一 个 例子 ， 考 虑 下 面 的 两 个 命题 : 


older(joanne, jake) c mother(joanne, jake) 


wiser(joanne, jake) colder(joanne, jake) 


使 用 归结 ， 我 们 就 能 够 从 这 两 个 命题 构造 出 下 面 的 命题 : 


wiser(joanne, jake) cmother(joanne, jake) 


归结 构造 的 机 制 很 简单 : 将 两 个 命题 的 左边 的 项 “与 ”在 一 起 ， 以 产生 新 命题 的 左边 ， 
将 两 个 命题 的 右边 的 项 “与 ”在 一 起 ， 以 产生 新 命题 的 右边 ， 然 后 ， 删 除 掉 同时 出 现在 新 命 
题 两 边 的 项 。 当 命题 的 一 边 或 两 思 具 有 多 个 项 时 ， 归 结 的 过 程 也 完全 相同 。 新 命题 的 左边 最 
急 包 含 了 ， 两 个 给 定 命题 的 左边 的 所 有 项 。 新 命题 的 右边 最 初 包含 了 ， 两 个 给 定 命 题 的 右边 
的 所 有 项 。 然 后 ， 删 除 掉 同 时 出 现在 新 命题 两 边 的 项 。 例 如 ， 如 果 我 们 有 : 

father(bob, jake) U mother(bob, jake) c parent(bob, jake) 

grandfather(bob, fred) c father(bob, jake) N father(jake, fred) 


所 归结 出 的 命题 是 : 

mother(bob, jake) U grandfather(bob, fred) c parent(bob, jake) N father(jake, fred) 

原来 两 个 命题 中 的 原子 命题 ， 除 了 其 中 的 一 个 外 ， 都 出 现在 所 归结 出 的 命题 中 。 第 一 个 
命题 中 的 左边 、 和 第 二 个 命题 中 的 右边 的 原子 命题 ， 父 亲 (bob，jake) ， 使 得 归结 操作 能 够 
进行 ， 然 后 再 被 删除 。 上 一 个 命题 的 意思 为 : 
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MI: bob 是 jake 的 父母 ， 蕴 涵 着 ，bob 不 是 jake 的 父亲 就 是 jake 的 母亲 

并 且 : bob 是 jake 的 父亲 ，jake 是 fred 的 父亲 ， 弄 涵 着 bob 是 fred 的 祖父 

那么 如果 bob 是 jake 的 父母 ， 并 且 jake 是 fred 的 父亲 

AA: 要 么 bob 是 jake 的 母亲 ， 豆 号 要 么 bob 是 fred 的 祖父 

实际 上 的 归结 ， 要 比 这 些 简 单 例子 复杂 得 多 。 特 别 是 ， 在 命题 中 所 出 现 的 变量 ， 需 要 归 
结 的 过 程 为 这 些 变量 找到 值 ， 以 使 得 匹配 过 程 能 够 成 功 。 这 种 为 变量 确定 有 用 值 的 过 程 ， 就 
称 为 合 一 〈unification) 。 为 了 进行 合 一 而 临时 给 变量 赋值 ， 就 称 为 实例 化 (instantiation), 

通常 ， 归 结 过 程 可 能 将 一 个 变量 实例 化 为 一 个 值 ， 但 如 果 后 来 无 法 完成 所 必需 的 匹配 ， 
归结 过 程 必须 回 湖 ， 并 将 变量 实例 化 为 另外 一 个 不 同 的 值 。 我 们 将 会 在 Prolog 的 上 下 文中 更 
多 地 讨论 合 一 和 回 渊 过 程 。 

归结 中 一 种 关键 的 重要 特性 ， 是 它 能 够 在 一 组 给 定 的 命题 中 ， 发 现任 何不 一 致 性 。 这 个 
性 质 允 许 了 将 归结 用 于 证 明定 理 ， 所 用 方法 是 ， 我 们 可 以 将 使 用 谓词 演算 的 定理 证 明 ， 想 像 
成 为 一 组 给 定 的 相关 命题 ， 这 组 命题 包括 所 要 证 明 的 定理 的 非 。 如 果 归 结 发 现 所 要 证 明 的 定 
理 的 非 ， 与 其 他 的 命题 不 一 致 ， 定 理 就 得 到 证 明 。 这 是 一 种 反 证 法 。 典 型 的 是 ， 将 原 有 的 命 
题 称 为 假设 (hypothese)， 而 将 定理 的 非 称 为 目标 (goal), 

在 理论 上 ， 这 是 一 种 有 效 和 有 用 的 过 程 。 然 而 ， 归 结 所 需要 的 时 间 则 可 能 成 为 问题 。 吕 
然 当 命题 的 集合 为 有 限 的 时 ， 归 结 将 会 是 一 个 有 限 的 过 程 ， 但 是 在 一 个 大 的 命题 数据 库 中 寻 
找 不 一 致 ， 所 需要 的 时 间 可 能 是 很 长 的 。 

定理 证 明 是 逻辑 程序 设计 的 基础 。 可 以 将 所 要 进行 的 计算 表示 为 ， 一 组 假设 、 及 使 用 归 
结 从 这 些 假设 推断 出 的 目标 ， 这 组 假设 就 是 给 定 的 事实 与 关系 。 

当 将 命题 用 于 归结 时 ， 只 能 够 使 用 一 种 被 限制 的 子 句 形式 ， 这 种 形式 进一步 简化 了 归结 过 
程 。 这 种 特别 的 命题 ， 就 称 为 霍 恩 子 名 (Horn clause) 。 霍 因子 句 只 能 具有 两 种 形式 ， 它 们 的 
左边 只 有 一 个 原子 命题 ， 或 者 左边 为 空 。 有 时 将 一 个 子 句 形式 命题 的 左边 ， 称 为 首 (head) ， 
具有 左边 的 霍 因 子 句 被 称 为 有 首 的 霍 因子 句 。 有 首 的 霍 恩 子 句 被 用 来 描述 关系 ， 如 ， 


likes(bob, trout) clikes(bob, fish) N fish(trout) 


通常 是 使 用 左边 为 空 的 圭 恩 子 句 ， 来 陈述 事实 ， 我 们 将 这 种 子 句 ， 称 为 无 首 的 霍 恩 子 句 。 
例如 ， 


father (bob, jake) 

可 以 使 用 霍 恩 子 句 来 描述 大 部 分 的 命题 ， 然 而 并 不 是 可 以 描述 所 有 的 命题 。 
16.4 逻辑 程序 设计 概述 

用 于 逻辑 程序 设计 的 语言 ， 被 称 为 说 明 性 语言 ， 这 是 因为 使 用 这 些 语言 所 编写 的 程序 ， 
是 由 声明 组 成 的 ， 而 不 是 由 赋值 和 控制 流程 语句 组 成 的 。 实 际 上 ， 这 些 声明 就 是 符号 涩 辑 中 
的 语句 ， 即 命题 。 

远 辑 程序 设计 语言 的 必要 特征 之 一 ， 是 被 称 为 说 明 语 义 (declarative semantics) 的 语义 。 
这 种 语义 的 基本 概念 ， 即 是 通过 一 种 简单 方法 就 可 以 决定 每 一 条 语句 的 意义 ， 而 且 这 并 不 依 
赖 这 一 条 语句 是 怎样 被 用 于 解决 问题 的 。 说 明 语义 比 命令 式 语言 的 语义 简单 得 多 。 例 如 ， 在 
一 种 逻辑 程序 设计 语言 ， 一 个 给 定 命题 的 意义 能 从 语句 的 本 身 准 确 地 确定 。 而 在 一 种 命令 


日 ” 霍 思 子 句 以 Alfred Hom 的 姓氏 命名 ，Alfred Horn 曾 经 研究 这 种 形式 的 子 句 (Hom, 1951). 
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式 语言 中 ， 要 确定 一 条 简单 赋值 语句 的 语义 ,我 们 需要 检查 局 部 的 声明 ， 需 要 有 语言 作用 域 
规则 的 知识 ， 甚 至 还 可 能 需要 检查 其 他 文件 中 的 程序 ， 以 确定 这 一 条 赋值 语句 中 变量 的 类 型 。 
如 霖 赋值 表达 式 包含 了 变量 ， 我 们 还 必须 追踪 这 一 条 赋值 语句 以 前 的 程序 的 执行 ， 以 确定 那 
些 变 量 的 值 。 然 后 ， 语 句 所 产生 的 行动 结果 ， 还 取决 于 它 的 运行 时 上 下 文 。 将 所 有 这 些 与 单 
一 语句 的 简单 检查 进行 比较 ， 由 于 不 需要 考虑 文本 的 上 下 文 或 执行 的 顺序 ， 显 然 ， 说 明 语 义 
还 比 命令 式 语言 的 语义 简单 。 因 此 ， 说 明 语义 时 常 被 描述 为 说 明 性 语言 相对 于 命令 式 语言 也 
优点 之 一 (Hogger,，1984,，pp. 240-241), 

命令 式 语言 和 函数 式 语言 中 的 程序 设计 ， 主 要 是 过 程 的 ， 这 意味 着 程序 人 员 必 须知 道 一 
个 程序 要 完成 什么 ， 并 且 教 计算 机 怎样 来 进行 所 需要 的 计算 。 换 句 话 说 ， 是 将 计算 机 当 作 一 
个 服从 命令 的 简单 装置 。 每 一 种 计算 都 必须 具有 计算 中 的 每 一 个 细节 。 一 些 人 相信 这 是 对 于 
计算 机 进行 程序 设计 的 困难 的 实质 。 

多 辑 程序 设计 语言 中 的 程序 设计 是 非 过 程 的 。 这 些 语 言 中 的 程序 并 不 描述 究竟 如 何 来 计 
算 一 种 结果 ， 而 仅仅 是 描述 这 种 结果 的 形式 。 这 里 的 区 别 是 我 们 假设 计算 机 系统 在 某 种 程度 
上 能 够 日 行 决定 如 何 来 得 到 结果 。 为 了 给 逻辑 程序 设计 语言 提供 这 种 能 力 ， 我 们 需要 一 种 简 
明 的 方式 向 计算 机 提供 有 关 的 信息 ， 以 及 提供 计算 获得 所 需 结果 的 推理 方法 。 谓 词 演 算 提 供 
了 一 种 与 计算 机 通信 的 基本 形式 ， 而 归结 则 提供 了 一 种 推理 技术 。 

一 个 常常 用 来 说 明 过 程 的 和 非 过 程 的 系统 之 间 不 同 的 例子 ， 就 是 排序 。 在 一 种 与 C++ 类 似 
的 语言 中 进行 排序 ， 我 们 必须 使 用 C++ 的 程序 向 一 台 具 有 C++ 编 译 器 的 计算 机 ， 解 释 某 一 种 排 
序 算法 的 所 有 细节 。 在 这 台 计 算 机 将 C++ 程 序 ， 翻 译 成 为 机 器 码 或 某 种 解释 性 的 中 间 代 码 后 ， 
接受 指令 产生 已 经 排序 了 的 链表 。 

在 一 种 非 过 程 的 语言 中 ， 就 只 需要 描述 排序 了 的 链表 的 特性 ， 它 是 给 定 的 链表 的 某 一 种 
排列 ， 使 得 每 一 对 相 邻 的 元 素 间 都 满足 某 一 种 给 定 的 关系 。 更 加 形式 的 描述 则 为 ， 假设， 将 
要 被 排序 的 链表 存放 在 一 个 命名 为 list 的 数组 中 ， 这 个 数组 的 下 标 范围 是 从 1 到 n。 如 果 是 将 存 
放 在 命名 为 “old_list” 的 数组 中 的 元 素 排 序 ， 并 将 这 些 排序 的 元 素 存放 到 另外 一 个 命名 为 
“new_list” 的 分 立 的 数组 中 ， 那 么 ， 就 可 以 将 这 种 排序 的 概念 表示 如 下 : 

sort(old_list, new_list) cpermute(old_list, new, list) (| sorted(new_list) 


sorted(list) c y jsuch that] <j < n, list(j)<list(j+1) 


这 里 的 permute (交换 ) old_list 是 一 个 谓词 ， 如 果 它 的 第 二 个 参数 数组 ， 是 它 的 第 一 个 参 
数 数组 的 一 种 排列 ， 它 将 返回 真 。 

从 上 面 的 描述 中 我 们 可 以 看 到 ， 非 过 程 的 语言 系统 可 以 产生 已 经 排序 的 链表 。 似 乎 非 过 
程 程序 设计 就 像 产生 一 种 简明 的 软件 需求 说 明 一 样 容易 。 然 而 事情 并 没 这 么 简单 。 仅 仅 使 用 
归结 的 逻辑 程序 ， 具 有 机 器 效率 上 的 严重 问题 。 此 外 ， 直 到 现在 人 们 仍然 没有 确定 ， 什 么 是 
多 辑 语言 的 最 好 的 形式 ， 并 且 直 到 现在 人 们 仍然 没有 在 逻辑 程序 设计 语言 中 开发 出 ， 为 大 型 
问题 建造 程序 的 好 方法 。 


16.5 Prolog 的 起 源 


正如 在 第 2 章 中 所 描述 的 ，Aix-Marseille 大 学 的 Alain Colmerauer 和 Phillippe Roussel pÆ 
丁 堡 大 学 的 Robert Kowalski 的 帮助 下 ， 开发 了 Prolog 的 基本 设计 。 Colmerauer 和 Roussel 对 于 
日 然 语言 处 理 感 兴趣 ， 而 Kowalski 则 对 于 自动 定理 证 明 感 兴趣 。 这 两 个 大 学 之 间 的 合作 ，、 
和 卫 继 续 到 20 世 纪 70 年 代 中 期 。 自 此 以 后 ，Prolog 语 言 的 开发 和 使 用 的 研究 ， 在 这 两 个 地 方 独 


FARATE 465 


了 立地 进行 ， 结 朱 就 产生 了 Prolog 的 两 种 语法 不 相同 的 方言 。 

在 爱丁堡 和 Marseille 之 外 ，Prolog 的 开发 ， 以 及 其 他 逻辑 程序 设计 研究 的 努力 ， 并 没有 得 
到 太 多 的 注意 。 直 到 1981 年 日 本 政府 发 起 了 一 个 很 大 的 、 称 为 第 五 代 计 算 机 系统 (FGCS) 的 
研究 计划 (Fuchi, 1981; Moto-oka，1981)。 这 个 计划 的 主要 目的 之 一 ， 是 开发 智能 机 器 ， 
Prolog 被 选 来 作为 这 项 工作 的 基础 。FGCS 的 公告 ， 唤 起 了 研究 人 员 和 美国 及 一 些 欧洲 国家 的 
政府 ， 对 于 人 工 智能 和 逻辑 程序 设计 的 突然 的 强烈 兴趣 。 

在 短 短 十 年 以 后 ，FGCS 项 目 就 终止 了 。 开 始 时 ， 人 们 对 于 逻辑 程序 设计 和 Prolog 的 潜力 ， 
抱 有 巨大 的 期 望 。 但 最 终 却 极 少 具有 重大 意义 的 发 现 。 这 导致 了 对 于 Prolog 的 兴趣 与 使 用 的 误 
减 。 尽 管 如 此 ，Prolog 仍 然 不 乏 自己 的 应 用 领域 和 支持 者 。 


16.6 Prolog 的 基本 元 素 


Prolog 现 在 有 着 许多 不 同 的 方言 。 可 以 将 这 些 方言 分 成 几 个 类 型 : 由 Marseille 小 组 所 开 
发 的 ， 来 自爱 丁 堡 小 组 的 ， 以 及 为 微型 计算 机 所 开发 的 方言 ， 如 由 Clark 和 McCabe (1984) 
所 描述 的 micro-Prolog。Prolog 方 言 的 语法 形式 ， 是 不 相同 的 。 我 们 不 打算 描述 不 同 的 
Prolog 方 言 , 或 者 是 这 些 方言 的 混合 语言 的 语法 , 我 们 只 是 选择 一 种 特定 的 广泛 可 用 的 方言 ， 
这 就 是 在 爱丁堡 大 学 开发 的 方言 。 有 了 时， 将 这 种 语言 的 形式 称 为 爱丁堡 语法 。 它 的 第 一 种 
实现 ， 是 在 一 台 DEC System-10 机 器 上 (Warren et al., 1979), Prolog 已 经 被 实现 在 几乎 
所 有 第 用 的 计算 机 平台 上 。 例 如 ， 你 可 以 从 Free Software Organization 的 网 站 来 获取 
(http://www.gnu.org) ) 。 


| 


16.6.1 项 


与 在 其 他 语言 中 的 程序 一 样 ，Prolog 的 程序 由 语句 的 集合 所 组 成 。 在 Prolog 中 ， 只 有 少数 
几 种 语句 ， 但 是 这 些 语句 可 能 是 复杂 的 。Prolog 的 所 有 的 语句 都 由 项 所 构成 . 

Prolog 的 项 (term) ， 是 一 个 常量 、 变 量 或 结构 。 一 个 常量 是 一 个 原子 (atom) 或 整数 
原子 是 Prolog 中 的 符号 值 ， 它 与 LISP 中 的 原子 相 类 似 。 一 个 原子 则 尤为 特别 ， 它 或 者 是 以 小 
写字 母 开始 的 一 串 字母 、 数 字 和 下 划 线 (_) ， 或 者 是 使 用 单 引号 所 界定 的 ， 一 串 任何 可 以 打 
印 的 ASCII 的 字符 。 

一 个 变量 是 以 大 写字 母 开 始 的 一 串 字母 、 数 字 和 下 划 线 。 变 量 不 是 通过 声明 来 与 类 型 相 
绑 定 的 。 将 值 与 类 型 到 变量 的 绑 定 ， 称 为 实例 化 。 实 例 化 仅仅 发 生 于 归结 过 程 中 。 将 一 个 没 
有 被 赋值 的 变量 ， 称 为 未 实例 化 的 变量 。 变 量 的 实例 化 ， 仅 仅 持续 到 它 满足 了 一 个 完整 的 目 
标 为 止 ， 它 涉及 一 个 命题 的 证 明 或 反 证 。 就 语义 与 使 用 方面 而 言 ，Prolog 中 的 变量 仅仅 是 命 
令 式 语言 中 的 变量 的 “远亲 ”。 

项 的 最 后 一 个 种 类 ， 称 为 结构 。 结 构 表示 谓词 演算 的 原子 命题 ， 它 们 的 一 般 形 式 都 是 相 
同 的 ， : 

函数 符 (参数 表 ) 

函数 符 是 任何 原子 ， 它 被 用 来 标识 结构 。 参 数 表 可 能 是 一 组 原子 、 变 量 或 其 他 的 结构 ， 
正如 下 一 节 中 将 要 仔细 讨论 的 ， 结 构 是 Prolog 中 说 明 事实 的 方式 。 也 可 以 将 这 些 结构 认为 
是 对 象 ， 它 们 允许 使 用 一 些 相关 的 原子 来 描述 事实 。 在 这 种 意义 上 ， 结 构 也 是 关系 ， 因 为 
它们 描述 原子 之 间 的 关系 。 当 一 个 结构 的 上 下 文 说 明 它 是 一 个 查询 (问题) 时， 结构 还 是 
一 个 谓词 。 
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16.6.2 事实 语句 


我 们 首先 讨论 Prolog 里 用 来 构造 假设 或 假定 信息 数据 库 的 语句 。 从 这 些 语句 中 ， 可 以 推断 
出 新 的 信息 。 

Prolog 具 有 两 种 基本 的 语句 形式 ， 它 们 分 别 对 应 于 谓词 演算 里 ， 无 首 和 有 首 的 霍 恩 子 句 。 
Prolog 中 无 首 霍 因子 句 的 最 简单 形式 ， 是 一 种 单一 结构 ， 这 种 结构 被 解释 成 为 无 条 件 的 断言 ， 
即 事实 。 在 逻辑 上 ， 事 实 就 是 被 假定 为 真 的 命题 。 

下 面 的 示例 ， 说 明 一 个 Prolog 程序 中 的 事实 。 注 意 ， Prolog 中 的 每 一 条 语句 都 是 以 句点 
结尾 的 。 


female(shelley). 
male(bill). 
female(mary). 
male(jake). 
father(bill, jake). 
father(bill, shelley). 
mother(mary, jake). 
mother(mary, shelley). 


ik EE ie] SEMI AK jake, shelley, billfimaryMjH#EX, lan, B—RAEN 
描述 shelley 是 一 位 女性 。 最 后 的 四 个 结构 ， 使 用 在 函数 符 原子 中 所 命名 的 关系 ， 来 连接 它 
们 的 两 个 参数 ， 例 如 ， 可 以 将 第 五 个 命题 解释 为 ，bi11 是 jake 的 父亲 。 注 意 ， 这 些 Prolog 
命题 承 像 谓词 演算 中 的 命题 一 样 ， 没 有 固有 的 语义 。 它 们 的 语义 ， 就 是 程序 人 员 赋 予 它们 的 
语义 。 例 如 ， 合 题 : 


father (bill, jake). 


可 以 意味 着 bill 和 jake 有 相同 的 父亲 ， 或 者 jake 是 bill 的 父亲 。 然 而 最 通常 并 且 也 
是 最 直接 的 意义 为 ，bill 是 jake 的 父亲 。 


16.6.3 规则 语句 


Prolog 中 用 来 构造 数据 库 的 、 另 外 一 种 基本 形式 的 语句 ， 对 应 于 有 首 的 霍 因子 句 。 这 种 形 
式 ， 与 一 个 已 知 的 数学 定理 相关 联 ， 如 果 一 组 给 定 的 条 件 被 满足 的 话 ， 就 可 以 从 这 个 已 知 的 
定理 得 出 一 个 结论 。 右 边 是 前 件 ， 即 如 果 (if) 部 分 ， 左 边 是 后 件 ， 即 那么 (then) 部 分 。 
如 霖 一 条 Prolog 语 句 的 前 件 为 真 ， 那 么 语句 的 后 件 也 必定 为 真 。 因 为 它们 都 是 霍 恩 子 句 ， 
Prolog 语 句 的 后 件 是 单个 的 项 ， 而 前 件 则 可 能 是 单个 的 项 或 合 取 的 项 。 

合 取 包含 被 逻辑 “与 ”运算 所 分 开 的 多 个 项 。 在 Prolog 中 ,“ 与 ”运算 是 隐 式 的 。 在 合 取 
中 说 明 原 子 命题 的 结构 ， 由 逗 点 分 开 ， 因 此 我 们 可 以 认为 ， 逗 点 就 是 “与 ”运算 符 。 作 为 合 
取 的 一 个 例子 ， 考 虑 : 


female (shelley), child (shelley). 
Prolog 的 有 首 霍 恩 子 句 语句 的 一 般 的 形式 为 : 
后 件 _1: — 前 件 表达 式 . 


可 以 将 它 读 为 : 如 果 前 件 表达 式 为 真 ， 或 通过 它 的 变量 实例 化 使 得 它 为 真 ， 则 后 件 为 真 。 
例如 ， 
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ancestor (mary, shelley); - mother (mary, shelley). 

HAM, MRmaryeshelleyMHR, ilmaryshelley—(tiai¥, MEKE 
因子 句 称 为 规则 ， 因 为 它们 描述 命题 之 间 的 蕴涵 规则 。 

和 谓词 演算 中 的 子 句 形式 命题 一 样 ，Prolog 中 的 语句 能 够 通过 使 用 变量 ， 来 将 它们 的 含义 
一 般 化 。 回 忆 ， 子 句 形式 中 的 变量 ， 提 供 了 某 种 隐 式 的 全 称 限 定 符 。 下 列 的 程序 段 ， 示 范 了 
Prolog 语句 中 的 变量 使 用 : 


parent(X, Y) :- mother(X, Y). 

parent(X, Y) :- father(X, Y). 

grandparent(X, Z) :- parent(X, Y) , parent(Y, Z). 

sibling(X, Y) :- mother(M, X) , mother(M, Y), 
father(F, X) , father(F, Y). 


这 些 语 句 给 出 了 变量 或 通用 对 象 之 间 的 蕴涵 规则 。 这 里 的 通用 对 象 是 Xx，Y，z ，M 和 F 。 
第 一 条 规则 所 描述 的 是 ， 如 果 有 X 和 Y 的 实例 化 导致 了 mother (X, Y) 为 真 ， 则 对 于 x 和 Y 的 那 
些 相 同 的 实例 化 ， 将 导致 parent (x, Y) WH, 


16.6.4 目标 语句 


到 目前 为 止 ， 我 们 已 经 描述 了 逻辑 命题 的 Prolog 语 句 ， 这 些 语句 被 用 来 描述 已 知 的 事实 ， 
以 及 这 些 事实 之 间 的 逻辑 关系 。 这 些 语 句 是 定理 证 明 模 型 的 基础 。 定 理 是 以 一 种 命题 的 形式 
出 现 ， 我 们 希望 系统 地 来 证 明 或 反 证 这 些 命题 。 在 Prolog 中 ， 将 这 些 命题 称 为 目标 或 查询 
Prolog 目 标语 句 的 语法 形式 ， 与 无 首 的 霍 恩 子 句 相同 。 例 如 ， 我 们 可 以 有 : 


man (fred). 


系统 对 于 这 个 命题 的 回应 ， 或 者 是 yes ， 或 者 是 no。 回 答 yes ， 意味 着 系统 根据 给 定 的 
证 明 目 标 为 真 。 回 答 no， 则 意味 着 系统 证 明了 目标 为 假 ， 或 者 系统 

不 能 够 证 明 它 。 

合 取 的 命题 和 有 变量 的 命题 ， 也 都 是 合法 的 目标 。 当 有 变量 时 ， 系统 不 但 需要 证 明 目 标 
的 真 假 ， 还 需要 识别 导致 目标 为 真 的 变量 的 实例 化 。 例 如 ， 可 以 使 用 ， 


father (X, mike). 


来 提出 问题 。 然 后 系统 将 会 使 用 合 一 ， 来 试图 找 出 导致 目标 为 真 的 x 的 实例 化 。 

因为 目标 语句 和 一 些 非 目标 语句 ， 具 有 着 相同 的 形式 (无 首 的 霍 恩 子 句 ) ，Prolog 的 实现 
必须 具有 采种 方式 来 区 别 这 两 者 。 交 互 式 的 Prolog 实 现 ， 使 用 两 种 模式 来 进行 区 别 ， 并 且 使 用 
不 同 的 交互 提示 ， 来 指示 这 两 种 模式 :一 种 模式 是 用 来 输入 事实 和 规则 语句 ， 另 外 一 种 则 用 
来 输入 目标 。 用 户 在 任何 时 候 都 可 以 改变 模式 。 


16.6.5 ” Prolog 的 推理 过 程 


这 一 节 讨 论 Prolog 的 归结 。 为 了 有 效率 地 使 用 Prolog， 程序 人 员 需 要 精确 地 知道 Prolog 系 
统 是 怎样 处 理 其 他 程序 的 。 

将 查询 称 为 目标 (goal) 。 当 一 个 目标 是 一 个 复合 命题 时 ， 每 一 种 事实 (结构 ) 都 被 称 为 
FAR (subgoal)。 要 证 明 一 个 目标 为 真 ， 推理 过 程 则 必须 在 数据 库 中 找到 一 条 推论 规则 以 及 
一 条 事实 链 ， 这 条 链 将 目标 连接 到 数据 库 中 的 一 个 或 多 个 事实 之 上 。 例 如 ， 如 果 Q 是 目标 ， 那 
么 ， 或 者 Q 必 须 在 数据 库 中 被 发 现 是 一 个 事实 ， 或 者 这 个 推理 过 程 必须 找到 事实 P，， 以 及 命题 
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的 一 个 序列 ， Pis Pis 8 aT 以 至 于 


Pe ik; 
Ps <= P35 
O:-£,, 


当然 ， 规 则 右边 的 复合 结构 以 及 规则 中 的 变量 ， 会 使 得 推理 过 程 复 杂 化 。 发 现 那 些 P 的 过 
程 ， 基 本 上 有 是 项 的 比较 或 匹配 的 过 程 。 

因为 证 明 一 个 子 目标 的 过 程 ， 是 一 个 命题 匹配 的 过 程 ， 有 了 时 将 它 就 称 为 匹配 。 在 某 些 情 
况 下 ， 将 证 明子 目标 称 为 满足 子 目 标 。 

考虑 下 面 的 查询 : 

man (bob). 

这 是 一 条 最 简单 类 型 的 目标 语句 。 归 结 可 以 相对 容易 地 确定 它 是 真 还 是 假 : 将 这 个 目标 
的 模式 ， 与 数据 库 中 的 事实 和 规则 进行 比较 。 如 果 数 据 库 中 包括 了 事实 : 


man (bob). 


那么 证 明 就 是 十 分 容易 的 。 然 而 ， 如 果 数 据 库 中 包含 了 下 面 的 事实 以 及 推理 规则 : 

father (bob). 

man (X):-father(X). 

Prolog 首 先 需 要 找到 这 两 条 语句 ， 并 使 用 它们 来 推断 目标 的 真实 性 。 这 就 需要 使 用 合 一 ， 
从 而 将 X 暂 时 实例 化 为 bob。 

现在 考虑 下 面 的 目标 : 


man (X). 


在 这 种 情况 下 ，Prolog 必 须 将 目标 与 数据 库 中 的 命题 匹配 。 它 所 找到 的 第 一 个 命题 ， 应 该 
与 目标 具有 相同 的 形式 ， 并 且 是 以 任何 对 象 作 为 参数 ， 这 个 命题 将 会 使 得 X 被 实例 化 为 这 个 对 
象 的 值 。 然 后 将 Xx 显示 为 结果 。 如 果 没 有 与 目标 形式 相同 的 命题 ， 系 统 就 会 回答 no， 以 说 明 
目标 不 能 够 被 满足 。 

企图 将 一 个 给 定 目标 与 数据 库 中 的 事实 相 匹配 ， 可 以 有 着 两 种 相反 的 方式 。 系 统 能 够 从 
数据 库 的 事实 及 规则 开始 ， 试 图 来 找到 导致 目标 的 一 个 匹配 序列 。 将 这 种 方式 称 为 自 底 向 上 
归结 (bottom-up resolution) 或 前 向 链接 (forward chaining ) 。 另 外 一 种 方式 是 从 目标 开始 ， 
试图 来 找到 一 个 匹配 命题 序列 ， 这 将 会 被 引 向 数据 库 中 原 有 事实 的 某 一 个 集合 。 将 这 种 方式 
称 为 自 项 向 下 归结 (top-down resolution) 或 后 向 链接 (backward chaining)。 大 体 上 ， 当 候选 
的 答案 集合 适当 小 的 时 候 ， 后 向 链接 较 适用 。 当 候选 答案 的 数目 相当 大 时 ， 前 向 链接 较 适 
用 ; 在 后 一 种 情形 下 ， 后 向 链接 将 会 需要 非常 大 量 的 匹配 ， 才 能 够 得 出 答案 。Prolog 的 实现 ， 
使 用 后 向 链接 来 进行 归结 ， 我 们 推测 这 是 因为 它 的 设计 人 员 相 信 ， 对 于 大 多 数 问题 ， 后 向 链 
接 比 前 向 链接 更 加 适用 。 

下 面 例子 说 明 前 向 链接 和 后 向 链接 的 不 同 之 处 。 考 虑 查询 : 


man (bob). 


假设 数据 库 包 含 了 : 


father (bob). 
man (X):- father (X). 
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前 向 链接 将 会 寻找 并 找到 第 一 个 命题 。 然 后 通过 将 XxX 实例 化 为 bob， 来 实现 第 一 个 命题 与 第 
二 条 规则 的 右边 (father (X)) 的 匹配 ， 最 后 再 将 第 二 个 命题 的 左边 ， 与 目标 进行 匹配 。 后 
向 链接 则 会 首先 通过 将 X 实 例 化 为 bob， 从 而 使 目标 与 第 二 个 命题 的 左边 (man (X)) 相 匹 配 。 
最 后 的 步骤 ， 它 将 会 使 第 二 个 命题 的 右边 (现在 是 father (bob))， 与 第 一 个 命题 相 匹 配 。 

当 目 标 具 有 多 种 结构 时 ， 就 像 在 我 们 上 面 的 例子 中 的 那样 ， 会 出 现下 面 的 这 种 设计 间 题 。 
这 个 问题 就 是 : 究竟 是 使 用 深度 优先 ， 还 是 宽度 优先 来 寻找 答案 。 深 度 优先 搜索 在 为 第 一 个 
子 目标 找到 一 个 完整 的 命题 序列 ( 即 证 明 ) 之 后 ， 再 处 理 另 一 个 子 目 标 。 宽 度 优先 的 搜索 ， 
并 行 地 工作 于 一 个 给 定 目标 的 所 有 子 目 标 。Prolog 的 设计 人 员 ， 之 所 以 主要 选择 深度 优先 的 方 
式 ， 是 因为 深度 优先 只 需要 较 少 的 计算 机 资源 。 宽 度 优 先 的 方式 是 并 行 搜索 ， 这 种 方式 使 用 
很 多 的 内 存 空间 。 

必须 讨论 的 Prolog 归 结 机 制 的 最 后 一 个 特性 ， 就 是 回 滴 。 当 系统 处 理 一 个 具有 多 个 子 目 标 
的 目标 时 ， 当 如 果 无 法 证 明 某 个 子 目 标的 真 值 时 ， 系 统 将 会 放弃 所 不 能 够 证 明 的 子 目 标 。 然 
后 系统 将 重新 考虑 前 一 个 子 目 标 ， 如 果 这 个 子 目 标 存 在 的 话 ， 而 且 将 试图 找到 其 他 的 解决 办 
法 。 将 这 种 回 到 前 面 的 子 目标 ， 称 为 回 滴 。 当 停止 一 个 子 目标 时 ， 系 统 将 回 到 其 起 始点 ， 从 
那里 再 重新 开始 搜索 新 的 解决 方法 。 一 个 子 目 标 变 量 的 不 同 实例 化 ， 可 能 导致 这 个 子 目 标的 
多 种 解决 办 法 。 因 为 回 湖 可 能 必须 找到 每 一 个 子 目标 的 所 有 可 能 的 证 明 ， 所 以 回溯 将 会 需要 
很 多 的 时 间 和 空间 。 这 些 子 目标 的 证 明 ， 可 能 没有 很 好 地 组 织 起 来 ， 以 便 尽 量 地 减少 找到 最 
终 的 完整 证 明 的 时 间 ， 这 种 情形 就 使 得 问题 更 加 糟糕 。 

伪 虑 下 面 的 这 个 例子 可 以 加 强 对 于 回 蛮 的 理解 。 假 设 ， 在 一 个 数据 库 中 有 一 组 事实 及 规 
则 ， 并 且 给 予 了 Prolog 下 面 这 个 复合 目标 : 


male (X), parent (X, shelley). 


这 个 目标 是 在 问 ， 是 否 具 有 X 的 一 个 实例 化 以 使 得 x 为 一 位 男性 ， 而 且 X 是 shelley 的 父 
母 。Prolog 首 先 将 在 数据 库 中 找 函 数 符 为 nale (BE) 的 第 一 个 事实 。 然 后 它 将 Xx 实例 化 为 
所 找到 事实 的 参数 ， 例 如 mike。 然 后 它 再 试图 证 明 parent (mike, shelley) 为 真 。 如 
有 打 证 明 失 败 ， 它 将 回 湖 到 它 的 第 一 子 目 标 male (x)， 并 尝试 使 用 Xx 的 某 一 个 其 他 可 能 的 实例 
化 ， 来 满足 这 个 子 目标 。 在 找到 一 个 是 shelley 的 父母 的 男性 之 前 ， 归 结 过 程 可 能 必须 搜索 
数据 库 中 的 每 一 个 “male”。 它 肯定 必须 查找 所 有 的 “male”， 以 便 证 明 目 标 不 能 够 被 满足 。 
请 注意 ， 如 果 将 我 们 的 例子 中 的 两 个 子 目 标的 次 序 颠 倒 ， 这 个 例子 目标 的 处 理 可 能 会 更 有 效 
率 。 这 样 ， 就 会 首先 找到 shelley 的 父母 ， 再 试图 将 它 与 “male” 子 目标 相 匹 配 。 如 果 在 
数据 库 中 shelley 的 父母 比 男性 少 (这 是 一 个 合理 的 假设 )， 这 样 效率 就 更 高 。 我 们 将 在 
16.7.1 小 三里 讨论 ，Prolog 系 统 中 用 来 限制 回溯 的 方法 。 

在 Prolog 中 数据 库 搜 索 总 是 按 从 第 一 条 到 最 后 一 条 语句 的 方向 进行 。 

下 面 的 两 个 小 节 ， 描 述 Prolog 中 的 一 些 示 例 ， 以 便 更 进一步 地 说 明 归 结 过 程 。 


16.6.6 简单 算术 
Prolog 支持 整数 变量 和 整数 算术 。 最 初 ， 算 术 运 算 符 就 是 函数 符 ， 所 以 7 和 变量 x 的 和 被 
+ (7, X) 


Prolog 现 在 允许 一 种 带 有 is 操作 符 的 更 简略 的 算术 语法 。 这 个 操作 符 的 右边 操作 数 是 一 个 
和 拭 术 表达 式 ， 左 边 操 作 数 是 一 个 变量 。 表 达 式 中 的 所 有 变量 必须 已 经 实例 化 ， 但 是 左边 的 变 
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量 不 能 是 已 实例 化 的 。 例 如 ， 

Ais B/17+C. 

如 采 B 和 C 都 被 实例 化 ， 但 R 还 没有 ， 那 么 ， 这 个 子 句 会 将 R 实 例 化 为 右边 表达 式 的 值 。 当 
这 种 情况 发 生 时 ， 子 句 被 满足 。 如 果 B 或 C 没 有 被 实例 化 ， 或 者 R 已 经 被 实例 化 ， 上 面子 句 不 
饼 满 足 ， 并 且 将 不 会 发 生 &A 的 实例 化 。is 命 题 的 语义 ， 与 命令 式 语 言 中 赋值 语句 的 语义 ， 非 
前 不 同 。 这 种 不 同 可 能 导致 一 种 有 趣 的 情形 。 因 为 is 操作 符 使 得 它 所 在 的 子 句 ， 看 起 来 就 像 
赋值 语句 一 样 ，Prolog 语 言 的 初学 者 也 许 会 写 出 这 样 的 一 条 语句 ; 

Sum is Sum + Number. 


这 条 语句 在 Prolog 中 是 无 用 的 ， 并 且 还 是 不 合法 的 。 如 果 “sum” 没 有 被 实例 化 ， 右 边 对 
它 的 引用 就 是 无 定义 的 ， 因 而 子 句 注定 会 失败 。 因 为 在 计算 is 操 作 符 时 ， 左 边 的 操作 数 不 能 
是 已 经 实例 化 的 ， 所 以 如 果 “Sum” 已 经 被 实例 化 ， 子 名 就 会 失败 。 因 此 在 任何 情况 下 ， 都 
不 可 能 将 “Sum ”实例 化 为 一 个 新 的 值 。( 如 果 需 要 “Sum+Numbezr” 的 值 ， 就 可 以 将 它 绑 定 
到 茶 一 种 新 名 字 上 。) 

Prolog 中 没有 与 命令 式 语 言 相同 意义 的 赋值 语句 。 在 Prolog 被 设计 来 进行 的 大 部 分 程序 设 
计 ， 并 不 需要 赋值 语句 。 在 命令 式 语 言 中 ， 赋 值 语句 的 使 用 价值 ， 依 赖 于 程序 人 员 控 制 伐 有 
赋值 语句 的 代码 的 执行 控制 流 的 能 力 。 因 为 在 Prolog 中 ， 这 种 类 型 的 控制 并 非 总 是 可 能 的 ， 所 
以 这 种 赋值 语句 就 远 没 那么 有 用 。 

作为 在 Prolog 中 使 用 数值 计算 的 一 个 简单 的 例子 ， 考 虑 下 面 问题 ,假如 我 们 知道 在 一 条 特 
定 跑道 上 ， 一些 汽车 的 平均 速度 ， 而 且 知 道 这 些 汽 车 在 跑道 上 的 时 间 。 我 们 就 能 够 将 这 些 其 
本 信息 编码 为 事实 ， 而 可 以 将 速度 、 时 间 和 距离 之 间 的 关系 编写 为 规则 ， 如 下 面 所 示 ， 

speed(ford, 100). 

speed(chevy, 105). 

speed(dodge, 95). 

speed(volvo, 80). 

time(ford, 20). 

time(chevy, 21). 

time(dodge, 24). 

time(volvo, 24). 

distance(X, Y) :- speed(x, Speed), 


time(X, Time), 
Y is Speed * Time. 


现在 ， 我 们 就 可 以 查询 某 一 辆 特定 汽车 旅行 的 距离 。 例 如 ， 查 询 ; 


distance (chevy, chevy Distance). 


实例 “chevy_Distance” 的 值 为 2205。 距 离 计 算 语 句 右 边 的 前 面 两 个 子 句 ， 仅仅 是 
将 变量 “Speed” 和 “time”， 实 例 化 为 给 定 汽车 函数 符 中 的 对 应 值 。 在 满足 了 目标 后 ， 
Prolog 也 将 显示 名 字 “chevy Distance” 和 它 的 值 。 

现在 从 操作 的 角度 ， 来 审视 一 个 Prolog 系 统 是 怎样 生产 结果 的 ， 将 是 很 有 帮助 的 。 
Prolog 具 有 一 个 被 命名 为 trace 的 内 建 结 构 ， 在 试图 满足 给 定 目 标的 期 间 ， 这 种 内 建 结 构 将 
显示 从 变量 到 值 的 实例 化 过 程 中 的 每 一 个 步骤 。 Trace 被 用 来 理解 和 调试 Prolog 的 程序 。 为 
了 更 好 地 了 解 trace 结 构 ， 最 好 先 介绍 Prolog 程 序 执 行 的 一 种 不 同 的 模型 ， 它 被 称 为 追踪 
模型 。 


追踪 模型 用 四 个 事件 来 描述 Prolog 的 执行 : (1) 调用 (call)， 发生 在 开始 试图 满足 一 个 目 
标 时 ; (2) 退出 (Exit)， 发 生 在 一 个 目标 已 经 被 满足 时 ，(3) Bik (redo) ， 发 生 在 回调 引起 
试图 重新 满足 一 个 目标 时 ; (4) 失败 (fail), 发生 在 一 个 目标 失败 时 。 如 果 将 像 上 面 “ 距 离 ” 
一 样 的 过 程 ， 视 为 子 程序 ， 调 用 与 退出 的 事件 ， 就 能 够 与 命令 式 语言 中 子 程序 的 执行 模式 ， 
直接 关联 。 男 外 的 两 个 事件 ， 是 逻辑 程序 设计 系统 所 独 有 的 。 在 下 面 的 追踪 示例 中 ， 这 里 的 
目标 不 要 求 重 做 或 失败 事件 。 

下 面 是 对 于 计算 Chevy_Distance 值 的 一 个 追踪 : 

trace. 


distance (chevy, chevy Distance). 


调用 : distance(chevy, 0)? 
调用 : speed(chevy, _5)? 


(1) 1 
(2).2 
(2) 2 退出 : speed(chevy, 105) 

(3) 2 调用 : time(chevy, 6)? 

(3) 2 退出 : time(chevy, 21) 

(4) 2 调用 :， _0 is 105*21? 

(4) 2 退出 ， 2205 is 105*21 

(1) 1 退出 : distance(chevy, 2205) 


Chevy Distance = 2205 


在 追踪 里 由 下 划 线 字符 (C) 所 开始 的 符号 ， 是 用 来 存储 实例 化 值 的 内 部 变量 。 第 一 列 指示 
当前 正在 试图 匹配 的 子 目 标 。 例 如 在 上 面 的 追踪 里 ， 具 有 (3 ) 的 第 一 行 ， 是 试图 将 临时 变量 “6 
实例 化 为 chevy 的 一 个 “time” 的 值 ， 这 里 的 “time”， 是 描述 “distance” 计 算 语句 中 右 
边 的 第 二 个 项 。 第 二 列 则 指示 匹配 过 程 的 调用 深度 。 第 三 列 指示 当前 的 动作 ，。 

为 了 举例 说 明 回 湖 ， 考 虑 下 面 的 数据 库 以 及 追踪 的 复合 目标 示例 : 


likes (jake,chocolate). 
likes (jake,apricots). 
likes (darcie, licorice). 


likes (darcie,apricots). 


trace. 


likes (jake,X), likes (darcie, X). 


(1) 
(1) 
(2) 
(2) 
(1) 
(1) 
(3) 
(3) 


调用 : likes (jake, _0)? 

退出 : likes (jake, chocolate) 
WH: likes (darcie, chocolate)? 
失败 : likes (darcie, chocolate) 
重 做 : likes (jake, 0)? 

iki}; likes (jake, apricots) 
调用 : likes (darcie, apricots)? 


e 上 关 上 


退出 : likes (darcie, apricots) 
X = apricots 


我 们 可 以 使 用 图 形 的 方式 想像 Prolog 的 计算 :将 每 一 个 目标 视 为 一 个 具有 四 个 端口 的 方 格 ， 
这 四 个 端口 就 是 调用 、 失 败 、 退 出 和 重 做 。 控 制 通 过 调用 端口 ， 按 照 向 前 的 方向 进入 一 个 目 
标 。 控 制 也 可 以 通过 重 做 端口 ， 按 照 向 后 的 方向 进入 一 个 目标 。 控 制 能 够 以 两 种 方式 来 离开 
一 个 目标 : 如 果 目 标 成 功 ， 控 制 将 通过 退出 端口 离开 ， 如 果 目 标 失败 ， 控 制 则 将 通过 失败 端 
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口 离开 。 图 16-1 显 示 了 上 面 示例 的 一 种 模型 。 在 这 个 示例 中 ， 控 制 流程 经 过 每 一 个 子 目 标 两 
次 。 第 二 个 子 目标 在 第 一 次 失败 后 ， 控 制 通过 重 做 ， 返 | 
回 第 一 个 子 目标 。 调用 失败 


iB tH 


到 目前 为 止 ， 我 们 所 讨论 的 唯一 的 Prolog 数 据 结构 ， 退 重 做 
是 原子 命题 ， 这 种 结构 看 起 来 更 像 是 一 个 函数 调用 ， 而 | 
不 像 一 个 数据 结构 。 原 子 命题 ， 也 称 为 结构 ， 实 际 上 是 调用 失败 
一 种 记录 的 形式 。Prolog 支 持 的 另外 一 种 基本 的 数据 结 
构 ， 是 链表 ， 它 与 LISP 使 用 的 链表 结构 相 类 似 。 链 表 是 


任意 数目 的 元 素 的 序列 ， 这 些 元 素 可 以 是 原子 、 原 子 命 A mi 
题 或 任何 其 他 的 项 ， 也 包括 其 他 的 链表 。 | 

Prolog 使 用 ML 和 Haskell 的 语法 ， 来 说 明 链 表 。 使 ”图 16-1 用 于 目标 : likes(jake, x), 
用 过 点 将 元 素 分 隔 开 ， 并 且 使 用 方 括号 来 给 整个 链表 定 likes(darcie, xX) 的 控制 流 
Fr, Un: 程 模型 


[apple, prune, grape, kumquat] 


标记 法 [ ] ， 用 来 表示 空 链表 。Prolog 不 具有 用 来 构造 和 拆散 链表 的 显 式 函 数 ， 而 是 使 用 
一 种 特别 的 标记 法 。[X 1 Y] 表示 一 个 头 为 Xx， 尾 为 Y 的 链表 ， 这 里 的 头 和 尾 ， 与 LISP 中 的 
CAR 和 CDR 相 对 应 。 这 种 方法 ， 也 与 Haskell 和 ML 中 使 用 的 表示 法 相 类 似 。 

一 个 链表 能 够 与 一 个 简单 结构 一 同 被 创建 ， 如 ， 

new_list ([apple, prune, grape, kumquat]). 

1X et WA Fe dt HE Z [apple, prune, grape, kumquat], 是 被 命名 为 new_1list (新 链表 ) 
的 关系 中 的 一 个 新 元 素 (我 们 刚刚 才 创 造 出 的 一 个 名 字 )。 这 一 条 语句 ， 并 没有 将 称 为 
new_1ist 的 变量 与 这 个 链表 相 绑 定 ， 相 反 ， 它 所 从 事 的 ， 是 命题 所 从 事 的 ， 如 ， 


male (jake) 


也 就 是 说 ， 它 描述 [apple,prune,grape,kumquat] 是 “新 链表 ” 的 一 个 新 元 素 。 因 
此 ， 我 们 可 以 具有 带 链表 参数 的 第 二 个 命题 ， 如 ， 


new_list([apricot, peach, pear]) 


在 查询 模式 里 ， 我 们 可 以 使 用 : 


new_list ([New_list_Head| New List Tail]) 


将 “new_1List” 的 元 素 之 一 ， 拆 散 为 头 与 尾 。 

aA “new_1ist” 具 有 上 面 的 两 个 元 素 ， 这 个 语句 将 “New_List Head’ 实例 化 为 
第 一 个 链表 元 素 的 头 (在 前 面 的 例子 里 是 apple)， 并 且 将 “New_List_Tail” 实 例 化 为 这 
个 链表 的 尾 (也 即 [prune, grape, kumquat])。 如 采 这 是 复合 目标 中 的 一 部 分 ， 而 且 回 
调 强 迫 对 它 重 新 求 值 ， “New_List Head” 和 “New_List Tail” 将 会 分 别 为 apricot 
和 [peach，pear]。 因 为 [apricot， peach, pear] % “new list” 的 下 一 个 元 素 。 

这 个 用 来 拆散 链表 的 操作 符 “|”， 也 可 以 被 用 于 从 给 定 实例 化 的 头 和 尾 ， 产生 出 链表 ， 如 


[Element_1 | List 2] 


ERR 43 


如 果 将 ELement_ 1 实例 化 为 pickle， 而 将 List_2 被 实例 化 为 [peanut, prune, 
popcorn]， 上 面 的 这 个 标记 法 ， 将 会 产生 链表 [pickle, peanut, prune, popcorn], 

如 上 面 所 述 ,， 包括 了 “| ”符号 的 链表 标记 法 是 通用 的 : 能 够 使 用 它 来 说 明 构 造 一 个 链表 ， 
也 能 够 使 用 它 来 说 明 拆散 一 个 链表 。 注 意 ， 下 面 的 各 项 是 相等 的 : 


[apricot, peach, pear | []] 
[apricot, peach | [pear]] 
[apricot | [peach, pear]] 


当 处 理 链表 时 ， 稼 和 需要 某 些 基本 的 操作 ， 如 在 LISP, ML 和 了 Haskell 中 的 那些 操作 。 作 为 
Prolog 中 的 这 些 操 作 的 一 个 示例 ， 我 们 来 考虑 append 的 定义 ， 它 与 LISP 中 的 这 种 函数 相关 。 
在 这 个 例子 中 ， 我们 将 能 够 看 到 函数 式 语言 和 说 明 性 语言 之 间 的 不 同和 相 类 似 之 处 。 我 们 并 
不 需要 说 明 Prolog 应 该 如 何 从 给 定 的 链表 ， 来 构造 一 个 新 链表 ， 我们 只 需要 就 给 定 的 链表 ， 来 
说 明 新 链表 的 特性 。 

从 外 表 上 看 ，Prolog 中 的 append 定 义 ， 非 常 类 似 于 在 第 15 章 中 出 现 的 ML 中 的 版 本 ， 并 
且 归 结 中 的 某 种 递归 ， 还 是 以 相 类 似 的 方式 来 生产 新 的 链表 。 在 Prolog 的 情况 下 ， 递 归 由 归结 
过 程 所 引起 ， 并 由 归结 过 程 来 控制 。 如 同 在 ML 和 Haskell 中 的 一 样 ， 模 式 匹配 过 程 被 用 来 在 两 
个 不 同 的 append 过 程 的 定义 之 间 进 行 选择 ， 这 种 选择 是 基于 实 参 的 。 

在 下 面 代 码 中 ，append 操 作 中 的 前 两 个 参数 ， 是 两 个 将 要 被 结合 在 一 起 的 链表 ; 第 三 个 
参数 是 结果 链表 : 


append([], List, List). 
append([Head | List 1], List 2, [Head | List 3]) :- 
append(List_1, List 2, List 3). 

第 一 个 命题 ， 说 明 当 将 空 链表 结合 到 任何 其 他 的 链表 上 时 ， 其 他 的 链表 就 是 结果 。 这 条 
语句 对 应 于 ML 中 的 append 函 数 的 递归 一 终结 步骤 。 注 意 终结 命题 被 放 在 递归 命题 前 。 这 是 
因为 Prolog 将 会 从 第 一 个 开始 ， 依 照 顺 序 来 匹配 这 两 个 命题 (因为 它 使 用 的 是 深度 优先 )。 

第 二 个 命题 ， 说 明 新 的 链表 的 一 些 特征 。 它 对 应 于 ML 函数 中 的 递归 步 又。 左边 的 谓词 ， 
朱 述 新 链表 中 的 第 一 个 元 素 与 第 一 个 给 定 链表 中 的 第 一 个 元 素 相 同 ， 这 两 个 第 一 个 元 素 都 命 
名 为 Head。 每 当 将 Head 实 例 化 为 一 个 值 时 ， 实 际 上 目标 中 Head 的 所 有 出 现 ， 都 被 实例 化 为 
同一 个 值 。 第 二 条 语句 的 右边 ， 说 明 将 第 二 个 给 定 的 链表 List_2 附 加 到 第 一 个 给 定 链表 
List_1 的 尾部 ， 形 成 结果 链表 List_3 的 尾 。 

可 以 将 append 的 第 二 条 语句 这 样 来 解读 仅 当 List_3 是 由 List_1 附 加 到 List_2 所 形 
成 时 ， 将 链表 [Head | List_1] 附加 到 任意 链表 List_2， 产 生 链 表 [Head IList_3]。 在 
LISP 中 ， 这 就 是 : 

(CONS (CAR FIRST) (APPEND (CDR FIRST) SECOND)) 


在 Prolog 和 LISP 这 两 种 语言 的 版 本 中 ， 一 直到 递归 产生 终结 条 件 时 ， 才 会 构造 出 结果 链 
表 ， 此 时 ， 第 一 个 链表 必定 已 经 成 为 空 表 。 然 后 再 使 用 append 函 数 本 身 ， 来 建造 结果 链表 ， 
从 第 一 个 链表 所 取出 的 元 素 ， 以 相反 的 次 序 加 入 到 第 二 个 链表 中 。 

为 了 说 明 append 是 怎样 工作 的 ， 考 虑 下 面 的 追踪 例子 : 

trace. 

append([bob, jo], [jake，darcie]， 家 庭 ). 


(1) 1 JARI: append([bob, jo], [jake, darcie], _10)? 
(2) 2 调用 : append([jo], [jake, darcie], _18)? 


~ 
Un 
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(3) 3 调用 : append([ ], [jake, darcie], _25)? 

(3) 3 退出 : append([ ], [jake, darcie], [jake, darcie]) 

(2) 2 退出 : append([jo], [jake, darcie], [jo, jake, darcie]) 

(1) 1 退出 : append([bob, jo], [jake, darcie], [bob, jo, jake, darcie] ) 

Family = [bob, jo, jake, darcie] 

yes 

前 面 的 两 个 调用 表示 子 目标 ， 其 中 的 List_1 非 空 ， 所 以 就 从 第 二 条 语句 的 右边 来 产生 递 
归 调 用 。 第 二 条 语句 的 左边 ， 有 效 地 说 明了 递归 调用 ， 或 目标 中 的 参数 ， 这 样 就 将 第 一 个 链 
表 拆 散 ， 一 步 一 个 元 素 。 在 第 一 个 调用 或 第 一 一 个 子 目 标 中 ， 当 第 一 个 链表 变 为 空 时 ， 第 二 条 
语句 的 右边 的 当前 实例 ， 通 过 匹配 第 一 条 语句 而 获得 成 功 。 这 样 做 的 效果 ， 是 将 空 链 表 值 附 
加 到 第 二 个 最 初 的 参数 表 上 ， 并 将 它 作为 第 三 个 参数 返回 。 连 续 的 退出 表示 成 功 的 匹配 ， 其 
中 将 从 第 一 个 链表 取出 的 元 素 ， 附 加 到 结果 链表 Family 上 。 当 从 第 一 个 目标 退出 完成 时 ， 过 
程 也 就 完结 ， 并 显示 出 结果 链表 。 

也 可 以 使 用 append 命 题 来 创建 其 他 的 链表 操作 ， 如 下 面 的 这 种 操作 ， 我 们 请 读者 来 确定 
它 的 功能 。 注 意 ，1List_op_2 具 有 一 个 链表 来 作为 它 的 第 一 个 参数 ， 以 及 它 具 有 一 个 变量 来 
作为 它 的 第 二 个 参数 ，1ist_op_2 的 结果 ， 就 是 第 二 个 参数 被 实例 化 的 值 。 


list op 2([], [])- 
list op 2([Head | Tail], List) :- 
list op 2(Tail, Result), append(Result, [Head], List). 


正如 读者 可 能 已 经 确定 了 的 ，1ist_op_2 导 致 Prolog 系 统 将 它 的 第 二 个 参数 实例 化 为 一 
个 链表 ， 这 个 链表 将 具有 第 一 参数 的 链表 中 元 素 ， 但 是 次 序 是 相反 的 。 例 如 ，([apple， 
orange，grape]，Q)， 将 0 实例 化 为 链表 [grape, orange, apple], 

这 叉 一 次 说 明了 ， 虽 然 LISP 和 Prolog 语 言 的 本 质 是 不 同 的 ， 但 仍然 能 够 使 用 相 类 似 的 方 
法 进行 相 类 似 的 操作 。 在 颠倒 操作 的 情况 下 ，Prolog 中 的 list_op 2， 和 LISP 中 的 reverse 
国 数 ， 都 包括 了 递归 终结 条 件 ， 以 及 将 链表 苏 倒 的 CDR， 或 者 是 将 尾 附加 到 链表 的 CAR， 或 链 
表 的 头 的 基本 过 程 ， 这 两 种 方法 在 一 起 构造 结果 链表 。 

下 面 是 这 个 过 程 的 追踪 ， 现 在 将 它 命 名 为 reverse; 


trace. 


reverse([a,b,.¢],Q). 


(1) 1 调用 : reverse([a, b, c], 6)? 
(2) 2 调用 : reverse([b, c], _65636)? 
(3) 3 调用 : reverse([c], 65646)? 

(4) 4 调用 : reverse([ ], _65656)? 

(4) 4 BH: reverse ([ ], [ ]) 

(5) 4 调用 : append([ ], [c], 65646)? 
(5) 4 BiH: append([ ], [c], [c]) 

(3) 3 退出 : reverse([c], [c]) 

(6) 3 调用 : append([c], [b], _65636)? 
(7) 4 调用 : append([ ], [b], _25)? 

(7) 4 退出 : append([ ], [b], [b]) 

(6) 3 退出 , append([c], [b], [c, b]) 
(2) 2 退出 : reverse([b, c], [c, b]) 
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(8) 2 调用 : append([c, b], [a], _6)? 

(9) 3 调用 : append([b], [a], _32)? 

(10) 4 调用 : append([ ], [a], _39)? 

(10) 4 退出 : append([ ], [a], [a]) 

(9) 3 退出 : append([b], [a], [b, a]l) 

(8) 2 BiH: append([c, b]; [a], [c, b, al) 
(1) 1 Bi: reverse([a, b, c], [c, b, al) 


OQ = Ce; D; a] 


假设 ， 我 们 需要 确定 所 给 定 的 符号 是 否 在 给 定 的 链表 中 。 一 种 直截了当 的 Prolog 的 描述 是 : 


member (Element, [Element | _]). 
member(Element, [_ | List]) :- member(Element, List). 


这 里 的 下 划 线 表示 匿名 变量 ， 用 来 表示 我 们 不 在 乎 从 合 一 过 程 得 到 什么 实例 化 的 变量 。 如 
A “Element” HANA, 不论 原先 就 是 、 还 是 经 过 多 次 递归 第 二 条 语句 之 后 ， 上 面 的 第 一 
条 语句 将 成 功 。 如 果 “Element” 是 在 链表 的 尾 ， 则 第 二 条 语 名 成功。 考虑 下 面 的 追踪 例子 ， 
trace. 
member (a, [by C; d]). 
(1) 1 WH: member(a, [b, c, d])? 
(2) 2 调用 : member(a, [c, d])? 
(3) 3 调用 : member(a, [d])? 
(4) 4 调用 : member(a, [ ])? 
(4) 4 失败 : member(a, [ ]) 
(3) 3 失败 ; member(a, [d]) 
(2) 2 失败 : member(a, [c, d]) 
(1) 1 失败 : member(a, [b, c, d]) 


no 


member (a, [b, a, c]). 

(1) 1 调用 : member(a, [b, a, c])? 
(2) 2 调用 : member(a, [a, c])? 
(2) 2 退出 : member(a, [a, c]) 

(1) 1 退出: member(a, [b, a, c]) 
yes 


16.7 Prolog 的 缺陷 


虽然 Prolog 是 一 种 有 用 的 工具 ， 但 它 既 不 是 一 种 纯粹 的 ， 也 不 是 一 种 完美 的 逻辑 程序 设计 
语言 。 这 一 小 节 将 讨论 Prolog 中 的 一 些 问 题 ，。 


16.7.1 归结 次 序 控 制 


因为 效率 的 原因 ，Prolog 允 许 用 户 在 归结 过 程 中 控制 模式 匹配 的 次 序 。 在 纯 逻辑 程序 设计 
的 环境 中 ， 归 结 过程 中 所 尝试 的 匹配 次 序 是 不 确定 的 ， 所 有 的 匹配 都 可 能 被 并 行 地 尝试 。 然 
而 ， 因 为 Prolog 总 是 以 相同 的 次 序 来 进行 匹配 ， 匹 配 开 始 于 数据 库 的 首部 以 及 给 定 目标 的 最 大 
边 ， 所 以 用 户 能 够 通过 将 数据 库 语 句 排序 ， 来 优化 一 种 特定 的 应 用 ， 从 而 对 效率 产生 巨大 影 
啊 。 例 如 ， 如 果 用 户 知道 在 一 个 特定 的 “执行 ”期 间 ， 某 一 些 规则 比 其 他 的 规则 更 有 可 能 成 
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功 ， 那么， 将 这 些 规则 放 在 数据 库 的 首部 ， 就 可 以 提高 程序 效率 。 

程序 执行 的 速度 慢 , 还 不 是 Prolog 程 序 中 用 户 定义 次 序 的 唯一 的 负面 结果 。 另 外 一 个 问题 ， 
是 非常 容易 写 出 无 限 循环 语句 ， 从 而 导致 整个 程序 的 失败 。 例 如 ， 考 虑 下 面 的 递归 语句 形式 : 

人 

因为 在 Prolog 中 不 论语 名 的 目的 是 什么 ， 总 是 按照 从 左 往 右 深度 优先 的 次 序 来 进行 计 
算 ， 上 面 语句 将 会 引起 一 个 无 限 循环 。 作 为 这 种 语句 的 一 个 例子 ， 考 虑 : 


ancestor(X, X). 
ancestor(X, Y) :— ancestor(Z, Y), parent(X, Z). 


在 试图 满足 第 二 个 命题 的 右边 的 第 一 个 子 目 标 时 ,Prolog 将 3 实例 化 , 以 使 得 ancestor 为 真 。 
然后 再 试图 去 满足 这 个 新 的 子 目标 ， 系 统 将 立刻 回 到 ancestor 的 定义 ， 并 重复 相同 的 过 程 ， 导 
致 无 穷尽 的 递归 。 

这 种 特定 的 问题 ， 与 将 一 个 递归 下 降 语 法 分 析 器 ， 用 于 有 左 递归 的 文法 规则 时 的 问题 相 
同 ， 这 个 问题 曾经 在 第 3 章 中 讨论 过 。 同 语法 分 析 中 的 文法 规则 的 情形 一 样 ， 只 需要 颠倒 上 面 
命题 中 右边 项 的 次 序 ， 就 会 将 这 个 问题 消除 。 这 种 做 法 的 麻烦 ， 是 仅仅 改变 项 的 次 序 ， 应 该 
不 至 于 影响 到 程序 的 正确 性 。 无 论 如 何 ， 不 需要 程序 人 员 关 心 控 制 次 序 ， 被 认为 是 逻辑 程序 
设计 的 优点 之 一 。 

除了 允许 用 户 控 制 数 据 库 和 子 目 标 次 序 之 外 ，Prolog 还 做 出 了 另外 的 一 种 迁就 ， 以 便 提 
高 效率 ， 这 就 是 允许 一 些 对 于 回溯 的 显 式 控制 。 这 是 通过 使 用 切口 (cut) 操作 符 来 进行 的 ， 
切口 操作 符 由 惊叹 号 (!) 说 明 。 切 口 操作 符 实际 上 是 一 个 目标 ， 而 不 是 一 个 操作 符 。 作 为 一 
个 目标 ， 它 总 是 立刻 成 功 的 ， 但 是 却 不 可 能 通过 回溯 来 重新 满足 。 因 此 切口 的 一 个 副作用 ， 
就 是 在 一 个 复合 目标 中 ,切口 左边 的 子 目 标 也 不 可 能 通过 回 济 来 重新 满足 。 例 如 ， 在 下 面目 
标 中 : 

A; Dy Ue Ce Or 

如 采 a 和 Pb 都 成 功 ， 但 c 失 败 ， 那 么 整个 目标 也 就 失败 。 如 果 我 们 知道 ， 只 要 c 失 败 ， 对 于 
a 或 b 的 重新 满足 只 是 浪费 时 间 而 已 ， 那 么 我 们 就 可 以 使 用 这 个 切口 目标 ， 来 避免 对 于 a 或 b 的 
重新 满足 。 

切口 操作 符 的 目的 ， 就 是 允许 用 户 告诉 系统 ， 不 要 去 试图 重新 满足 那些 不 可 能 产生 完整 
证 明 的 子 目 标 ， 从 而 提高 程序 的 效率 。 

作为 切口 操作 符 用 法 的 一 个 例子 ， 考 虑 来 自 16.6.7 小 节 的 member 规 则 ， 即 ， 


member(Element, [Element | _]). 
member(Element, [_ | List]) :- member(Element, List). 


如 采 membez 的 链表 参数 表示 一 个 集合 ,那么 它 将 只 被 满足 一 次 (集合 不 包含 重复 的 元 素 ) 
因此 ， 如 采 membez 在 一 个 多 子 目 标的 目标 语句 中 ， 被 当 作 子 目标 使 用 的 话 ， 就 可 能 存在 一 个 
问题 。 这 个 问题 就 是 ， 如 果 membez 成 功 ， 但 下 一 个 子 目标 失败 ， 回 淹 将 会 继续 一 个 先前 的 匹 
配 ， 企 图 重新 满足 member 。 但 因为 membez 的 链表 参数 开始 时 只 有 元 素 的 一 个 副本 ， 虽 然 可 
以 继续 尝试 以 重新 满足 member，member 却 不 可 能 再 一 次 成 功 ， 最 终 导致 整个 目标 的 失败 。 

例如 ， 考 虑 目标 


dem_candidate(X): -member(X, democrats), tests(X). 


该 目标 决定 一 个 给 定 的 人 是 否 是 民主 主义 者 ， 是 否 是 某 些 特定 职位 的 好 的 候选 者 。 为 了 
发 现 这 个 人 适合 的 职位 ，tests 子 目标 检测 给 定 的 民主 主义 者 的 许多 特征 。 如 果 民 主 主义 者 
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集合 没有 副本 ， 并 且 tests 子 目标 检测 失败 ， 那 么 我 们 不 想 转 到 member 子 目标 ， 因 为 没有 
副本 ，member 搜 索 所 有 其 他 民主 主义 者 也 会 失败 。member 子 目标 的 再 次 搜索 只 会 白白 浪费 
计算 时 间 。 对 于 这 个 问题 的 解决 办 法 ， 是 给 member 定 义 的 第 一 条 语句 ， 增 加 一 个 右边 ， 而 切 
口 操作 符 就 是 这 个 右边 中 的 唯一 元 素 ， 如 : 


member(Element, [Element | _]) :- !. 


回溯 将 不 会 企图 重新 来 满足 member ， 而 是 使 整个 子 目标 失败 。 

在 Prolog 中 一 种 称 为 产生 与 测试 (generate and test) 的 程序 设计 策略 中 ， 切 口 操作 特别 有 
用 。 在 这 些 程序 中 ， 目 标 由 子 目 标 所 组 成 ， 这 些 子 目标 产生 潜在 的 解决 方法 ， 这 些 方法 被 以 
后 的 “测试 ” 子 目 标 所 测试 。 被 拒绝 的 子 目标 需要 回 湖 到 “产生 妖 ” 子 目标 ， 它 产生 新 的 汶 
在 的 解决 方法 。 作 为 一 个 产生 与 测试 程序 的 例子 ， 考 虑 下 面 的 规则 ， 这 个 规则 出 现在 Clocksin 
and Mellish (1997) 文献 中 : 


divide(N1, N2, Result) :- is_integer (Result), 
Productl is Result * N2, 
Product2 is (Result + 1) * N2, 
Productl1 =< Nl, Product2 > Ni, !. 


这 个 程序 使 用 加 法 和 乘法 来 进行 整数 除法 。 因 为 大 多 数 的 Prolog 系 统 提 供 除 法 操作 符 ， 这 
个 程序 实际 上 并 没有 用 ， 这 里 只 是 用 来 举例 说 明 简 单 的 产生 与 测试 程序 。 

只 要 谓词 is_integer 的 参数 ， 能 够 被 实例 化 为 一 个 非 负 的 整数 ，is_integer 就 成 功 。 
如 果 它 的 参数 没有 被 实例 化 ，is_integer 将 它 实 例 化 为 值 0。 如 果 参 数 已 经 被 实例 化 为 一 
个 整数 ，is_integer 将 它 实例 化 为 下 一 个 更 大 的 整数 值 。 

因此 在 divide 中 ，is_integer 是 产生 器 子 目标 。 它 产生 序列 0，, 1,2,… 中 的 元 素 ， 每 
一 次 is_integer 被 满足 时 便 产 生 一 个 。 所 有 其 他 的 子 目标 都 是 测试 子 目标 ， 它 们 检测 
is_integer 所 生产 的 值 ， 是 否 为 前 两 个 参数 N1 和 N2 的 商 。 使 用 切口 来 作为 最 后 一 个 子 目标 
的 目的 ， 很 简单 : 为 了 避免 diviade 在 找到 答案 之 后 ， 又 试图 再 寻找 其 他 的 答案 。 虽 然 
is_integer 能 够 产生 一 个 巨大 数目 的 候选 答案 ， 但 其 中 只 有 一 个 是 答案 ;， 这样， 切口 操作 
就 避免 了 再 产生 第 二 个 答案 的 无 意义 的 企图 。 

切口 操作 符 的 使 用 ， 类 似 于 命令 式 语言 中 goto 的 使 用 (Van Emden，1980) 。 虽 然 有 时 是 
必需 的 ， 但 也 可 能 被 滥用 。 的 确 ， 有 时 是 使 用 它 来 使 逻辑 程序 具有 命令 式 程 序 设计 风格 的 控 
ll At EE 

逻辑 程序 设计 的 重要 优点 之 一 ， 是 不 需 说 明 如 何 来 解决 问题 ， 然 而 干预 控制 流程 的 能 力 
直接 损害 了 这 个 优点 ， 所 以 在 一 个 Prolog 程 序 中 干预 控制 流程 的 能 力 ， 是 一 种 缺陷 。 相 反 ， 这 
种 程序 只 需要 说 明 问 题 的 答案 。 这 使 得 程序 更 容易 编写 和 陪读。 它们 不 需要 说 明 如 何 解 决 问 
题 的 细 闻 ， 万 其 不 需要 说 明 计算 的 精确 步 又。 虽然 逻辑 程序 设计 并 不 需要 控制 流程 ， 但 主要 
是 为 了 高 的 效率 ，Prolog 程 序 还 是 时 常 使 用 它们 。 


16.7.2 封闭 世界 假设 


Prolog 归 结 的 性 质 ， 有 了 时 会 产生 误导 的 结果 。 就 Prolog 语 言 而 言 ， 唯 一 的 真 值 是 那些 能 够 
从 它 的 数据 库 得 到 证 明 的 。Prolog 不 具有 它 的 数据 库 之 外 的 世界 的 知识 。 对 于 任何 一 个 查询 ， 
如 采 在 数据 库 中 没有 充分 的 信息 来 证 明 , 就 认为 是 假 的 。Prolog 能 够 证 明 一 个 给 定 的 目标 为 真 ， 
但 是 它 不 能 够 够 证 明 一 个 给 定 的 目标 为 假 。 它 仅仅 假设 : 因为 它 不 能 够 证 明 一 个 目标 为 真 ， 
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所 以 这 个 目标 必定 为 假 。Prolog 实 质 上 是 一 个 “ 真 与 失败 ” 的 系统 ， 而 不 是 一 个 “ 真 与 假 
实际 上 ， 你 对 于 封 困 世界 的 假设 并 不 陌生 ， 它 与 我 们 的 司法 系统 有 着 相同 的 操作 方式 。 
嫌疑 犯 是 无 罪 的 ， 直 到 证 明了 他 有 罪 ， 嫌 疑犯 不 需要 被 证 明 是 无 罪 的 。 如 有 果 审 判 不 能 够 证 明 
一 个 人 有 罪 ， 他 即 被 认为 是 无 罪 的 。 
封闭 世界 假设 的 问题 与 否定 问题 相关 ， 关 于 这 些 将 在 下 一 小 市 中 讨论 。 


16.73 否定 问题 


Prolog 存 在 的 另外 一 个 问题 ， 是 处 理 否 定时 的 困难 。 考 虑 下 面 的 这 个 数据 库 ， 它 具有 两 个 
事实 和 一 个 关系 : 


parent(bill, jake). 
parent(bill, shelley). 
sibling(X, Y) :- (parent(M, X), parent(M, Y). 


现在 ， 假 设 我 们 键入 查询 : 

sibling (Xy Y). 

Prolog 系 统 将 回答 : 

X = jake 

Y = jake 

因此 ，Prolog 系 统 “ 认 为 ”jake 是 他 自己 的 兄妹 。 这 是 因为 系统 开始 将 M 实 例 化 为 bi11， 
并 将 Xx 实 例 化 为 jake， 以 便 使 得 第 一 子 目标 ，parent (M，X) ， 为 真 。 然 后 它 再 一 次 从 数据 
库 的 起 始 位 置 开始 匹配 第 二 个 子 目标 ，parent (M，Y)， 并 且 将 M 实 例 化 为 bi11， 以 及 将 Y 
实例 化 为 jake。 因 为 两 个 子 目标 被 独立 地 满足 ， 并 且 由 于 这 两 个 匹配 都 开始 于 数据 库 的 起 始 
位 置 ， 所 以 就 出 现 了 上 面 的 答案 。 为 了 避免 这 种 结果 ， 我 们 必须 说 明 : X 是 Y 的 兄妹 ， 仅 当 他 
们 都 有 相同 的 父母 时 ， 并 且 他 们 不 是 同一 个 人 。 但 是 ， 在 Prolog 中 来 描述 不 相等 ， 不 是 一 件 十 
分 容易 的 事 ， 我 们 将 在 后 面 会 讨论 这 一 点 。 最 准确 的 方法 ， 需 要 为 每 一 对 原子 增加 一 条 事实 ， 
以 描述 它们 的 不 相同 。 这 种 方法 当然 会 导致 数据 库 变 得 非常 庞大 ， 因 为 通常 ， 否 定 信 息 远 远 
多 于 正面 信息 。 例 如 对 于 大 多 数 的 人 ，364 天 都 不 是 生日 ， 只 有 一 天 是 生日 。 

一 种 简单 的 替代 方案 ， 是 在 目标 中 描述 X 不 能 够 与 Y 相 等 ， 如 : 

sibling (X, Y) :- parent (M, X), parent (M, Y), not(X = Y). 

在 其 他 的 情况 下 ， 这 种 解决 方案 并 不 是 这 么 简单 。 

在 上 面 的 情况 下 ， 如 果 归 结 不 能 够 满足 子 目 标 X = Y，Prolog 中 的 not 操 作 符 就 被 满足 。 因 
此 如 霖 not 成 功 ， 并 不 一 定 就 意味 着 Xx 不 等 于 Y， 相 反 ， 它 仅仅 意味 着 归结 不 能 够 从 数据 库 里 证 
明 X 等 于 Y。 因 此 ，Prolog 的 not 操 作 符 并 不 等 于 ， 逻 辑 NOT 操 作 符 ， 后 者 意味 着 可 以 证 明 它 的 
操作 数 的 真实 性 ， 是 为 真 的 。 如 果 我 们 碰巧 有 下 面 形式 的 目标 ， 这 种 非 等 价 性 则 会 产生 问题 : 

not (not(some-goal)). 

等 价 于 


Some_goal. 


如 采 Prolog 中 的 not 操 作 符 ， 是 真正 的 逻辑 NOT 操 作 符 ， 上 面目 标 会 等 价 于 某 个 目标 。 
然而 ， 在 某 些 情况 下 它们 是 不 相同 的 。 例 如 ， 再 一 次 来 考虑 member 规 则 : 
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member (Element, [Element | _]) :- !. 
member(Element, [_ | List]) :- member(Element, List). 


为 了 能 够 找 出 给 定 链表 中 的 一 个 元 素 ， 我 们 可 以 使 用 下 面目 标 : 

member(X, [mary, fred, barb]). 

它 将 使 得 Xx 实例 化 为 nary， 然 后 再 打印 出 来 。 但 如 果 我 们 是 使 用 : 

not(not(member(X, [mary, fred, barb]))). 

将 会 发 生 下 面 的 事件 序列 : 首先 ， 内 层 的 目标 会 成 功 ， 将 X 实 例 化 为 mary。 然 后 Prolog 
会 试图 来 满足 下 面 这 个 目标 : 

not(member(X, [mary, fred, barb])). 

因为 nember 成 功 ， 所 以 这 个 目标 会 失败 。 而 当 这 个 目标 失败 时 ， 将 会 取消 x 的 实例 化 ， 
因为 ，Prolog 总 是 取消 所 有 失败 目标 中 的 所 有 变量 的 实例 化 。 然 后 ，Prolog 会 试图 满足 外 层 的 
not 目 标 ， 这 会 成 功 ， 因 为 它 的 参数 已 经 失败 。 最 后 ， 将 打印 结果 ， 即 x。 但 是 x 现在 并 没有 
被 实例 化 ， 因 此 系统 将 报告 这 个 问题 。 没 有 被 实例 化 的 变量 通常 被 打印 为 一 串 以 下 划 线 开头 
的 数字 。 因 此 ，Prolog 的 not 不 等 于 逻辑 NOT， 这 件 事 实 至 少 是 误导 的 。 

为 什么 逻辑 NOT 不 可 能 成 为 Prolog 整 体 中 的 一 部 分 ”其 中 的 基本 缘由 来 自 于 霍 因子 名 的 
形式 : 

A :- Bi {Bs fh.» » (TB, 


如 采 所 有 的 B 命 题 都 为 真 ， 我 们 可 以 得 出 结论 a 为 真 。 但 是 不 论 任何 B 或 是 所 有 的 B， 是 真 
或 是 假 ， 我 们 都 不 可 能 得 出 结论 A 为 假 。 从 正 逻 辑 出 发 ， 我 们 只 能 得 出 正 逻 辑 的 结论 。 因 此 震 
恩 子 句 形 式 ， 避 免 了 任何 否定 的 结论 。 


16.7.4 内 在 的 限制 


如 在 16.4 节 所 描述 的 ， 逻 辑 程序 设计 的 一 个 基本 的 目标 ， 是 提供 非 过 程 的 程序 设计 ， 也 就 
是 使 用 这 种 设计 程序 人 员 ， 只 需要 说 明 一 个 程序 应 该 做 什么 ， 而 不 需要 说 明 怎样 去 做 的 系统 
可 以 将 前 面 排序 的 例子 重 写 在 这 里 ， 


sort(old_list, new_list) c permute(old_list, new_list) ^ sorted(new_list) 
sorted(list) c Vj such that 1 <j < n, list(j) < list(j+1) 


这 很 容易 使 用 Prolog 来 编写 。 例 如 ， 能 够 将 被 排序 的 子 目 标 表 示 为 : 


sorted ([]). 
sorted ([x]). 
sorted ([x, y | list]) :- x <= y, sorted ([y | list]). 


上 面 的 排序 程序 的 问题 ， 是 程序 并 不 知道 如 何 排序 ， 它 只 知道 枚 举 所 给 定 链表 的 所 有 排 
直到 它 碰巧 创建 了 排序 的 链表 ， 实 际 上 这 是 一 个 极 慢 的 过 程 。 
到 目前 为 止 还 没有 人 发 现 一 个 过 程 ， 能 够 将 已 经 排序 的 链表 的 描述 转换 成 为 某 一 种 高 效 
率 的 排序 算法 。 归 结 能 够 做 出 许多 有 趣 的 事情 ， 但 是 却 肯定 不 能 够 完成 这 项 工作 。 因 此 ， 一 
个 排序 链表 的 Prolog 程 序 ， 必 须 详细 地 说 明 如 何 排序 ， 如 同 在 命令 式 语言 或 函数 式 语言 中 的 
那样 。 

所 有 这 些 问题 ， 都 意味 着 逻辑 程序 设计 应 该 被 抛弃 ? 绝对 不 是 ! 以 逻辑 程序 设计 目前 的 形 
式 ， 它 就 能 够 处 理 许多 有 用 的 应 用 问题 。 此 外 ， 它 是 以 一 种 吸引 人 的 概念 作为 基础 ， 何 况 它 
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的 本 身 就 是 有 趣 的 。 最 后 一 点 ， 人 们 有 可 能 开发 出 某 种 新 的 推理 技术 ， 以 允许 罗 辑 程序 设计 
语言 系统 ， 高 效 地 处 理 日 益 增多 的 应 用 问题 。 


16.8 逻辑 程序 设计 的 应 用 


在 这 一 市 中 ， 我 们 简短 地 描述 逻辑 程序 设计 ， 特 别 是 Prolog 的 几 种 当前 的 和 潜在 的 重要 
应 用 。 


16.8.1 关系 数据 库 管理 系统 


关系 数据 库 管理 系统 (RDBMS )， 以 表格 的 形式 来 存储 数据 。 在 这 种 数据 库 上 的 查询 ， 
通常 是 使 用 SQL(Structured Query Language) 描 述 ， 与 逻辑 程序 设计 一 样 ，SQL 也 是 非 过 程 的 。 
用 户 不 需要 描述 应 该 如 何 取 得 答案 ， 相 反 ， 用 户 只 是 描述 答案 的 特征 。 逻 辑 程序 设计 和 关系 
数据 库 管 理 系统 之 间 的 连接 ， 应 该 是 很 明显 的 。 信 息 的 简单 表格 ， 就 能 够 使 用 Prolog 结 构 来 描 
述 ， 而 表 之 间 的 关系 ， 就 能 够 方便 而 且 容 易 地 使 用 Prolog 的 规则 描述 。 检 索 过 程 是 归结 操作 中 
所 固有 的 。Prolog 的 目标 语句 ， 为 关系 数据 库 管 理 系 统 提供 查询 。 逻 辑 程序 设计 十 分 自然 地 符 
合 实现 关系 数据 库 管 理 系统 的 需要 。 

使 用 逐 辑 程序 设计 实现 关系 数据 库 管理 系统 的 优点 之 一 ， 是 只 需 一 种 语言 。 在 典型 的 关 
系数 据 库 管理 系统 中 ， 一 种 数据 库 语 言 包括 不 同 语句 ， 来 进行 数据 定义 、 数 据 操作 和 查询 ， 
所 有 这 些 语句 ， 都 被 嵌入 一 种 通用 程序 设计 语言 中 ， 如 COBOL。 将 这 种 通用 的 语言 用 于 数据 
处 理 ， 以 及 输入 输出 的 功能 。 所 有 的 这 些 功能 ， 都 可 以 在 一 种 逻辑 程序 设计 语言 中 进行 。 

使 用 逐 辑 程序 设计 实现 关系 数据 库 管 理 系统 的 另外 一 个 优点 ， 是 内 建 的 推理 能 力 。 传 统 
的 RDBMS 不 能 够 从 数据 库 中 推断 出 任何 结论 ， 而 只 能 提供 存储 于 数据 库 中 的 数据 。 也 即 它们 
只 包含 事实 ， 而 不 包含 事实 规则 及 推理 规则 。 与 传统 的 关系 数据 库 管 理 系 统 比较 ， 使 用 逻辑 
程序 设计 实现 关系 数据 库 管理 系统 的 主要 缺点 ， 是 逻辑 程序 设计 的 实现 的 速度 比较 慢 。 使 用 
逻辑 推理 ， 比 使 用 平常 的 命令 式 程序 设计 技术 的 查询 方法 ， 需 要 更 长 的 时 间 。 


16.8.2 专家 系统 


专家 系统 ， 是 一 种 被 设计 来 在 一 些 特定 领域 中 模仿 人 类 专家 的 计算 机 系统 。 这 类 系统 ， 
由 一 个 事实 数据 库 、 一 个 推理 过 程 、 一 些 有 关 这 个 领域 的 启发 式 过 程 ， 以 及 某 种 友好 的 用 户 
接口 (它们 使 得 系统 像 一 个 内 行 的 人 类 顾问 ) 所 组 成 。 系 统 的 起 始 知识 库 由 人 类 专家 所 提 
供 ， 专 家 系统 能 够 在 使 用 过 程 中 学 习 ， 从 而 它们 的 数据 库 还 必定 能 够 动态 地 增长 。 另 外 ， 当 
专家 系统 决定 需要 什么 样 的 信息 时 ， 它 还 应 该 具有 包括 询问 用 户 之 类 的 获取 更 多 信息 的 能 力 。 

对 于 专家 系统 的 设计 人 员 而 言 ， 中 心 问 题 之 一 是 在 处 理 数 据 库 时 不 可 避免 的 不 一 致 性 和 
不 完备 性 。 尿 辑 程序 设计 似乎 很 适合 于 处 理 这 些 问 题 。 例 如 ， 默 认 推 理 规则 能 够 帮助 处 理 不 
完备 性 的 问题 。 

Prolog 能 够 、 并 且 已 经 被 用 来 构造 专家 系统 。 它 能 够 比较 容易 地 实现 专家 系统 的 基本 要 求 : 
使 用 归结 来 作为 查询 处 理 的 基础 ， 使 用 它 的 增加 事实 和 规则 的 能 力 来 提供 学 习 能 力 ， 以 及 使 
用 它 的 起 踪 设 施 来 告诉 用 户 一 个 给 定 的 结果 背后 的 推理 。Prolog 所 缺少 的 ， 是 在 需要 时 自动 询 
问 用 户 以 获得 额外 信息 的 能 力 。 

逻辑 程序 设计 在 专家 系统 中 一 种 最 著名 的 应 用 ， 是 称 为 APES 的 专家 系统 的 构造 系统 ， 在 
Sergot (1983) 和 Hammond (1983) 文献 中 对 它 进行 了 描述 。APES 系 统 包 括 一 个 非常 灵活 的 
设施 ， 用 于 在 专家 系统 构造 期 间 收 集 来 自用 户 的 信息 。 它 还 包括 了 第 二 个 解释 器 ， 用 来 产生 


对 它 的 查询 的 答案 所 进行 的 解释 。 
APES 已 经 被 成 功 地 使 用 ， 产 生 了 好 几 个 专家 系统 ， 其 中 的 一 个 ， 是 政府 社会 福利 计划 规 
则 的 专家 系统 ， 另 外 的 一 个 ， 是 英国 国籍 法 〈 即 英国 的 国籍 规则 ) 的 专家 系统 。 


16.8.3 自然 语言 处 理 


能 够 将 逻辑 程序 设计 用 于 某 些 类 型 的 自然 语言 处 理 。 特 别 是 ， 某 些 计算 机 软件 系统 的 自 
然 语言 的 接口 ， 可 以 方便 地 使 用 逻辑 程序 设计 来 建造 。 这 些 系统 包括 智能 数据 库 ， 以 及 其 他 
的 基于 知识 的 智能 系统 。 在 描述 语言 语法 的 方面 ， 人 们 发 现 逻 辑 程序 设计 的 形式 ， 与 上 下 文 
无 天 文法 等 价 。 另 外 ， 人 们 发 现 逻 辑 程序 设计 系统 中 的 证 明 过 程 ， 与 某 些 语法 分 析 的 策略 等 
价 。 事 实 上 ， 可 以 将 后 向 链接 归结 ， 直 接 用 于 能 够 用 上 下 文 无 关 文 法 描述 的 句子 ， 来 进行 语 
法 分 析 。 人 们 还 发 现 用 逻辑 程序 设计 对 语言 建 模 时 ， 自 然 语言 的 某 些 种 类 的 语义 ， 能 够 变 得 
更 加 清晰 。 尤 其 是 ， 在 基于 逻辑 的 语义 网 络 的 研究 中 ， 显 示 出 自然 语言 中 的 多 种 句子 ， 能 够 
使 用 子 句 形式 来 表达 (Deliyanni and Kowalski，1979)。 在 Kowalski (1979) 文献 中 也 讨论 了 
基于 迎 辑 的 语义 网 络 。 


小 结 


特写 边 辑 ， 为 逻辑 程序 设计 和 人 逻辑 程序 设计 语言 提供 了 基础 。 逻 辑 程序 设计 的 方法 ， 使 用 一 个 数据 
库 和 一 种 目 动 推理 的 过 程 ， 这 个 数据 库 包含 一 组 事实 ， 以 及 一 组 表述 事实 之 间 关 系 的 规则 ， 假 定数 据 库 
里 的 事实 和 规则 为 真 ， 这 种 自动 推理 过 程 将 检测 新 命题 正确 性 。 逻 辑 程序 设计 的 方法 ， 是 为 自动 的 定理 
证 明 而 开发 的 。 

Prolog 征 最 广泛 使 用 的 逻辑 程序 设计 语言 。 逻 辑 程序 设计 的 起 源 ， 是 Robinson 为 逻辑 推理 而 开发 的 
归结 规则 。Prolog 主 要 是 在 Marseille 大 学 ， 由 Colmeraur 和 Roussel 所 开发 的 ， 其 间 ， 爱 丁 堡 大 学 的 
Kowalski 给 予 了 一 些 帮助 。 

地 辑 程序 应 该 是 非 过 程 的 ， 这 意味 着 程序 只 需要 给 出 答案 的 特征 ， 而 不 需要 给 出 取得 答案 全 部 过 程 。 

Prolog 的 语句 ， 是 事实 、 规 则 或 目标 。 大 部 分 语句 是 由 原子 命题 的 结构 和 逻辑 算 子 所 组 成 的 ， 虽 然 
也 允许 了 算术 表达 式 。 

归结 ， 是 Prolog 解 释 器 的 主要 活动 。 归 结 过 程 ， 主 要 是 在 命题 中 进行 模式 匹配 ， 归 结 过 程 中 广泛 地 
使 用 回 湖 。 当 涉及 变量 时 ， 能 够 将 变量 实例 化 为 值 ， 以 提供 匹配 。 这 种 实例 化 过 程 ， 被 称 为 合 一 

逻辑 程序 设计 目前 的 状况 ， 存 在 着 许多 的 问题 。 为 了 提高 效率 ， 甚 至 是 为 了 避免 无 限 循环 ， 程 序 人 
员 有 时 必须 在 程序 中 描述 控制 流程 的 信息 。 加 之 ， 还 存在 着 封闭 世界 假设 和 否定 问题 。 

馆 辑 程序 设计 已 经 被 应 用 于 许多 不 同 的 领域 ， 主 要 是 在 关系 数据 库 系 统 、 专 家 系统 和 自然 语言 处 理 
的 方面 。 


文献 注释 


有 些 书 描述 了 Prolog 语 言 。Clocksin 和 Mellish (2003) 描述 了 爱丁堡 形式 的 Prolog 语 言 。Clark and 
McCabe (1984) 描述 了 Prolog 在 微型 计算 机 上 的 实现 。 

Hogger (1991) 写 了 一 本 关于 逻辑 程序 设计 通用 范围 的 优秀 书籍 。 它 也 是 本 章 关于 逻辑 程序 设计 应 
用 的 小 市 的 材料 来 源 。 


复习 题 


1. 在 形式 逻辑 中 符号 逻辑 的 三 种 主要 的 用 途 是 什么 ? 
2. 一 个 复合 项 中 的 两 个 部 分 是 什么 ? 


~) 


~ 
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3. 子 句 形式 的 命题 的 一 般 形 式 是 什么 ? 

4. 给 出 归结 和 合 一 的 一 般 〈 非 严格 的 ) 定义 。 

5. TAKER TAB? 

6. 说 明 语 义 的 基本 概念 是 什么 ? 

7. Prolog 中 的 项 的 三 种 形式 是 什么 ? 

8. 在 Prolog 中 ， 事 实 和 规则 语句 的 语法 形式 及 用 法 是 什么 ? 

9. 解释 在 一 个 数据 库 中 ， 将 目标 与 事实 相 匹 配 的 两 种 方法 。 
10. 解释 在 讨论 满足 多 目标 时 ， 深 度 优 先 与 宽度 优先 之 间 的 差别 。 
11. 解释 在 Prolog 中 回调 是 怎样 工作 的 。 

12. 解释 Prolog 语 句 ，K is K+1 中 的 错误 是 什么 。 

13. Prolog 程 序 人 员 在 归结 期 间 能 够 控制 模式 匹配 次 序 的 两 种 方法 是 什么 ? 
14. 解释 Prolog 中 的 产生 与 测试 的 程序 设计 策略 。 

15. 解释 Prolog 所 使 用 的 封闭 世界 假设 。 为 什么 它 是 一 种 限制 ? 
16. 解释 Prolog 中 的 否定 问题 。 为 什么 它 是 一 种 限制 ? 

17. 解释 自动 定理 证 明和 Prolog 的 推理 过 程 之 间 的 联系 。 

18. 解释 过 程 的 语言 与 非 过 程 的 语言 之 间 的 差别 。 

19. 解释 Prolog 的 系统 为 什么 必须 施行 回溯 。 

20. 在 Prolog 中 的 归结 和 合 一 之 间 的 关系 是 什么 ? 


练习 题 


1. 比较 Ada 和 Prolog 中 数据 类 型 化 的 概念 。 

2. 描述 如 何 使 用 一 个 多 处 理 器 的 计算 机 来 实现 归结 。 目 前 定义 版 本 的 Prolog 能 够 使 用 这 种 方法 吗 ? 

3. 使 用 Prolog 来 描述 你 的 家 谱 〈 仅 基于 事实 ) ， 上 漳 到 你 的 祖父 母 ， 并 且 包 括 他 们 所 有 的 后 代 。 确 保 包 
i SATAY aR Ko 

4. 编写 一 组 家 庭 关 系 规 则 ， 包 括 自 祖 父母 往 下 两 代 之 间 的 所 有 关系 。 将 这 些 规 则 加 入 练习 题 3 中 的 事 
K, 并 且 尽 可 能 多 地 删除 掉 所 能 删除 的 事实 。 

5. 使 用 霍 思 子 句 形 式 的 Prolog 来 编写 下 面 的 条 件 语 句 : 
a. 如 果 Fred 是 Mike 的 父亲 ， 则 Fred 是 Mike 的 祖先 。 
b. 如 果 Mike 是 Joe 和 Mary 的 父亲 ， 则 Mary 是 Joe 的 姐姐 (或 妹妹 ) 。 
c. 如 果 Mike 是 Fred 的 兄弟 ，Fred 是 Mary 的 父亲 ， 则 Mike 是 Mary 的 叔叔 。 

6. 解释 在 两 个 方面 ，Scheme 和 Prolog 的 表 处 理 功能 是 相似 的 。 

7. 在 什么 方面 ，Scheme 和 Prolog 的 表 处 理 功 能 是 不 相同 的 ? 

8. 写 出 Prolog 与 ML 语言 的 比较 ， 其 中 包括 它们 之 间 的 两 种 类 似 性 以 及 两 种 差别 。 

9. 从 一 本 关于 Prolog 的 书 中 学 习 、 并 写 出 对 于 一 种 “出 现 -- 检 测 ” 问 题 的 描述 。 为 什么 Prolog 人 允许 这 种 问 
题 存 在 于 它 的 实现 之 中 ? 


程序 设计 练习 题 


1. 编写 一 个 Prolog 程 序 ， 这 个 程序 找 出 一 个 数字 链表 的 最 大 数值 。 
2. 编写 一 个 Prolog 程 序 ， 如 果 两 个 给 定 链表 参数 的 交 为 空 时 ， 程 序 成 功 。 
3. 编写 一 个 Prolog 程 序 ， 这 个 程序 返回 一 个 包含 了 两 个 给 定 链表 中 元 素 的 并 的 链表 。 


4. 编写 一 个 Prolog 程 序 ， 这 个 程序 返回 一 个 给 定 链表 的 最 后 一 个 元 素 。 
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CIR (class instance record) (类 实例 记录 )，547 
Classes (%), 509 
abstract (抽象 ) 511, 528 
nested (WEHI), 516, 533, 535 
Thread (2&2), 583~585 
Class instance record (CIR) (实例 记录 )，547 
Class methods (类 方法 )，510 
Class variables (类 变量 )，510 
Clausal forms ( 子 名 形式) 346~347, 687~688 
Clauses ( 子 句 ) 
accept (accept 子 句 ) ，572 
declare (declare 子 句 ) 228 
finally (finally 子 句 ) ，627 一 628 
forms (形式 ) 346~347 
Horn (Æ ATAJ), 690 
others (others 子 句 ) 269 
throws (throws 子 句 ) 625 
Clients (of abstract data types) (抽象 数据 类 型 的 客户 )， 
472 
Closed-world assumptions (Prolog) (Prolog 语 言 的 封闭 世 
Fix), 710~711 
COBOL (COBOL 语 言 ) 62~67 
design process〈 设 计 过 程 )，63 一 64 
evaluation (评估 )，64 一 65 
historical background of (历史 背景 ) 63 
writabifty (可 写 性 )，15 
Code (代码 ) 
building (functions) (构造 国 数 ) 665 ~ 666 
byte 〈 字 位 码 ) 31 
Short Code (pseudocodes) (虚拟 码 的 短 代 码 )，44 一 45 
Coercion (强制 转换 ) 219 
in expressions (表达 式 中 的 ) 325~327 
Collection<?> wildcard type (collection 通 配 类 型 ) 428 
Colmerauer, Alain, 86, 692 
Column major order ( 按 列 存 放 )，274 
COMmerical TRANslator (COMTRAN) (COMTRANi& 
A), 63 
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Common Gateway Interface (CGI) (通用 网 关 接 口 ) 85, 
104 


COMMON LISP (COMMON LISPif =), 55~56, 666 


~ 667 
Communications of the ACM (ACM 通 信和 杂志 )，59，643 
Compatibility of types (类 型 兼容 性 )，219 
Compatible types (兼容 类 型 ) 223 
Competition synchronization (竞争 同步 )，560 
Ada (Adai#), 557~559 
Java threads (Java 线 程 ) 586~587 
monitors ( 管 程 ) 569 
semaphores (信号 量 ) 566~568 
Compilation (编译 ) 27~30 
Completed tasks 【完成 的 任务 ) 579 
Complexity of parsing (语法 分 析 的 复杂 性 ) ，178 
Compound assignment operators (复合 赋值 操作 符 ) ， 
333 一 334 
Compound terms (复合 项 ) 685 
Computer architecture (计算 机 体系 结构 )，20 一 22 
COMTRAN (COMTRAN 语 言 ) 63 
Concurrency (并 发 )， 
Ada (support for) (支持 Adai 语 言 
categories of (#H2E), 558~559 
C# threads (C#2R FE), 590~592 
design issues (设计 问题 )，563 
Java threads (Java 线 程 )，583 一 590 
message passing (消息 传递 )，570 ~ 583 
monitors ($FE), 568~570 
motivation for studying (学 习 动 机 )，559 
semaphores (信号 量 ) 563~568 
statement-level (语句 层 ) 559~592 
subprogram-level ( 子 程序 层 ) 539~543 
Conditional expressions (条 件 表达 式 ) 319 
Conditional targets (条 件 目 标 ) 333 
Conjunctions ( 合 取 )，695 
Canonical LR (Canonical LR 文 法 ) 191 
Consequent (随后 的 ) 687 
Consistency (of tags) (标志 一 致 性 的 )，288 
Constants (常量 ) 
enumeration ( 枚 举 )，259 
manifest (说 明 )，238 
named (命名 的 )，236 一 239 
readonly-named (只 读 方 式 命名 的 )，238 
Constrained variant variables ( 受 限 变 体 变量 ) 288 
Constructors (构造 器 ) 483 
Constructs (构造 ) 
iteration (%E{t), 356~371 
multiple selection (多 选择 ) ，350 一 356 
Context-free grammars ( 上下文 无 关 文 法 )，119 一 131 


J), 573~583 
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Continuation (继续 ) 606 
Control expressions (控制 表达 式 ) 346 
Control flow (控制 流 ) 
exception handling (异常 处 理 )，607 
Scheme (Scheme 语言 ) 654~655 
Control statements (控制 语句 )，12 一 13，344 
Control structures (控制 结构 )，345 
Conversion (转换 ) 
explicit type ( 显 式 类 型 转换 )，327 
implicit ( 隐 式 的 )，325 ~ 327 
narrowing ( 罕 化 )，324 
types (类 型 ) 324~327 
widening (%46), 324 
Cooper, Alan, 70~71 
Cooper, Jack, 88 
Cooperation synchronization (合作 同步 )，560 
Ada (Ada 语 言 ) 576~ 577 
Java threads (Java 线 程 ) 587~590 
monitors (fE), 569 
semaphores (信号 量 ) 564~566 
Coroutines (协同 程序 ) 77, 431~433 
quasi-concurrent ( 准 协 同 程序 ) 558 
Correctness (正确 性 ) 
partial (部 分 的 ) 152 
total (it), 152 
Cost of programming languages (程序 设计 语言 的 代价 )， 
18 一 20 
Counter-controlled loops (计数 器 控制 的 循环 )，357 一 
366 
design issues (设计 问题 ) 358 
Counters, reference (计数 器 、 引 用 ) 303 
CPU (central processing unit) (中 央 处 理 器 ) 20~21 
Currie, Malcolm, 88 


Cut (Prolog), 708 
D 


Dahl, Ole-Johan, 76 
Dangling pointers (悬挂 指针 )，293 一 294 
Dangling references (悬挂 引用 )，293 
Dartmouth College (Dartmouth 学 院 ) ，67 
Data abstraction (数据 抽象 )，16，22， 也 参照 抽象 数据 
类 型 
design issues (设计 问题 ) 494 
Databases (Prolog) (Prolog 语 言 的 数据 库 ) 91 
Data members (数据 成 员 )，432 
Data structures (数据 结构 )，13 
Data types (数据 类 型 ) 248 
array types (数组 类 型 ) 263~280 
associative arrays (相关 数组 ) 280~282 
Boolean (布尔 )，252 
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character (ZE), 253 
character string types (FERRI), 253 ~258 
complex (复杂 的 )，251 
decimal (十 进 制 )，252 
enumeration ( 枚 举 )，258 一 261 
floating point ( 浮 点 )，250 一 251 
integer, 250 
LISP (LISP 语 言 ) 647~648 
numeric (数值 的 ) 249~252 
ordinal (有 序 的 )，2$8 一 263 
pointers (指针 )，291 一 304 
primitives (基本 的 、 原 始 的 ) 249~253 
record types (记录 类 型 )，282 一 286 
subrange ( 子 范 围 )，261 一 263 
union types (联合 类 型 ) 286~290 
user-defined ordinal types (用 户 定 义 的 序数 类 型 )， 
258 ~ 263 
Deadlock ( 死 锁 )，563 
Deallocation (解除 分 配 )，215 
objects of (解除 分 配 的 对 象 )，$15 一 $16 
Decimal data types (小 数 数据 类 型 )，252 
Declarations (声明 ) 
variables (4), 209~210 
Decaratilve languages (陈述 性 语言 ) 684 
Decorating parse trees (修饰 语法 分 析 树 )，138 
Declarative semantics (说 明 语 义 )，690 
Declare clauses (Declare 子 句 ) ，228 
Deep access ( 深 访 问 )，461 一 463 
Deep binding (4%), 419 
Deferred reference counters (延迟 引用 计数 器 ) 301 
Delphi，97 
Denotational semantics (指称 语义 )，155$ 一 161 
assignment statements (赋值 语义 ) ，1$9 一 160 
evaluation (Ff), 160~161 
expressions (表达 式 )，158 一 159 
logical pretest loops (逻辑 先 测试 循环 ) 160 
state of programs (程序 状态 ) 158 
Department of Defense (DoD) (美国 国防 部 )，63，87 一 89 
Depth-first searches (Prolog) (深度 优先 搜索 ) 698 
Derefrencing (间接 引用 )，292 
Derivations (派生 )，121 © 123 
leftmost (最 左 的 ) 122 
Derived classes (派生 类 )，509 
Derived types (派生 类 型 ) 222~223 
Descriminants (判别 式 )，288 
ordinal types (序数 类 型 ) 259 
union types (联合 类 型 ) ，287 
Descriptors (描述 符 )，249 
Design issues 


arrays (数组 )，263 
character strings (字符 串 )，253 
counter-controlled loops (计数 器 控制 循环 )，358 
functions (r), 429 
logically controlled loops (逻辑 控制 循环 )，366 
multiple selection constructs (多 选择 结构 )，350 一 351 
names (4R), 203 
pointers (指针 ) ，292 
selection constructs (选择 结构 )，346 
two-way selectors (双向 选择 符 )，346 
union types (联合 类 型 )，287 
user-defined ordinal types (用 户 定义 的 序数 类 型 )，259 
Design process (设计 过 程 ) 
Ada, 88~89 
ALGOL 60, 59~60 
ALGOL 68, 77~78 
BASIC, 67~68 
C#, 105 
C++, 94~95 
COBOL, 63~64 
Fortran, 47 
Java, 97~98 
LISP, 52 
PL/I, 73 
Prolog, 86 
SIMULA 67, 76~77 
Smalltalk, 92 
Destructors ( 析 构 器 ) 483 
Diagrams (状态 图 )，171 一 172 
Diamond inheritance ( 葵 形 继承 ) 514 
Dictionaries (字典 ) 104 
Dijkstra，Edsger，74，372，569 
Direct left recursion (直接 左 递归 )，184 
Discriminants (判别 式 )，288 
Discriminated unions (判别 的 并 )，288 
Disjoint (tasks) (不 相交 任务 )，560 
Displays (显示 )，459 
DLL (dynamic linked library) (动态 链接 库 ) 484 
Documents (文档 ) 
XML (可 扩展 标记 语言 ) 108 
XSLT (可 扩展 语言 转换 )，108~ 109 
DoD (Department of Defense) 
Ada, 87~89 
COBOL, 63 
Domains (programming) (程序 设计 定义 域 )，5 一 7 
Do statements (Fortran 95) (Fortran 95 的 Do 语句 ) 358 
一 360 
Dot notation (for records) (Dot 符 号) 284 
Double precision ( 双 精 度 ) 251 
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Double types ( 双 精 度 类 型 ) 251 
Dynabook (笔记 本 型 号 ) ，92 
Dynamic binding (aJA 4h), 210, 511 
Ada 95, 537~538 
C#, 534~535 
C++, 526~528 
Java, 532~533 
methods (方法 ) 516 
object-oriented programming (OOP), 516 
type (类 型 ) 210~211 
Dynamic chains (动态 链 ) 447 
Dynamic length strings (动态 长 度 字 符 串 ) 256 
Dynamic linked library (DLL) (动态 链接 库 ) 498 
Dynamic links (动态 链接 ) 444 
Dynarnicscope (动态 范围 )，232 一 233 
evaluation (评估 )，233 
implementing (实现 ) ，461 一 464 
Dynamic semantics (动态 语义 )，140 一 161 
axiomatic semantics (公理 语义 )，143 一 155 
denotational semantics (指称 语义 )，1S$5 一 161 
operational semantics (操作 语义 )，141 一 142 
Dynamic type binding (RHE), 210~211 
Dynamic type checking (动态 类 型 检查 ) 219 
E 


Eager approach (积极 方法 ) 301 
EBNF (Extended BNF) (扩展 的 巴 科斯 -诺尔 范式 )， 
131~ 134 
ECMA (European Computer Manufacturers Association) 
(欧洲 计算 机 制造 协会 ) 101 
Edinburgh syntax (Edinburgh 语 法 ) 693 
Edwards, D.J., 649 
Eiffel, 96~97 
Elaboration (确立 )，216 
Elemental array operations (元 素数 组 操作 ) 270 
Elliptical references (省 略 引 用 )，285 
elsif clause (else 子 句 ) 355 
Encapsulation (封装 )，23，475$，495 一 498 
Ada, 497~498 
C, 496 
C#, 498 
C++, 496~497 
naming (Mm), 498~503 
nested subprograms (R&TTE), 495 
Enumeration constants ( 枚 举 常 量 ) 259 
Enumeration types ( 枚 举 类 型 ) 258~261 
enum types (enum 类 型 ) 259 
Environment pointer (EP) (环境 指针 ) ，440 ，445 
Environments (环境 ) 
local referencing (局 部 推理 ) ，395 一 397 
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programming (程序 设计 )，33 一 34 


Errors in expressions (表达 式 中 的 错误 )，327 一 328 
European Computer Manufacturers Association (ECMA) 


(欧洲 计算 机 制造 协会 )，101 


Evaluation (评估 ) 


of Ada, 89~90 

of Ada (concurrency), 582~583 

of ALGOL 60, 60~61 

of ALGOL 68, 78~79 

of arrays (数组 ) 273 

of axiomatic semantics (公理 语义 ) ，155 

of BASIC, 68~69 

of C,82 

of C#,107 

of C# support for OOP (支持 OOP 的 C#) 535 

of C# support for threads (支持 线程 的 C#) 592 

of C++,96 

of C++ abstract data types (C++ 抽象 数据 类 型 ) 484 
~ 485 

of C++ support for OOP (支持 OOP 的 C++)，529 一 530 

of COBOL, 64~65 

of denotational semantics (指称 语义 )，160 一 161 

of dynamic scoping (动态 作用 域 ) 233 

of enumeration types ( 枚 举 类 型 ) 261 

of Fortran, 49~50 

of Java, 99~ 100 

of Java support for OOP (支持 OOP 的 Java) 533 

of Java threads (Java 线 程 ) 590 

of languages (语言 ) 7~20 

of LISP, 54 

of monitors (Fz), 569~570 

of operational semantics (操作 语义 )，142 

of Pascal, 80 

of Perl, 84~85 

of PL/I, 74 

of Prolog, 87 

of records (记录 )，286 

of references (引用 )，298 一 299 

of semaphores (信号 量 )，568 

of Smalltalk, 93 

of Smalltalk support for OOP (支持 OOP 的 Smalltalk ) , 
518 

of static scoping (静态 作用 域 ) 229~231 

of strings (7H), 256~257 

of subrange types ( 子 范 围 类 型 ) 261~263 

of unions (HEA), 290 


Event Handlers (事件 处 理 器 ) 630 
Event handling (事件 处 理 ) 630 


Java，031 一 636 


Event listeners (事件 监听 器 ) 632 
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Events, 630, (classes) (事件 (28)), 610 
Exception handling (异常 处 理 )，602 ~ 608 
Ada, 608~615 
C++, 615~620 
design issues (设计 问题 ) , 605 ~ 608 
Java, 620~630 
reliability (可 靠 性 ) 17 
Exceptions (异常 ) 328, 603 
Exception handlers (5: ij NbFE ZS ), 603 
Exclusivity of objects 〈( 纯 对 象 模型 ) 512 
Expert systems (Prolog) (Prolog 的 专家 系统 )，714 一 715 
Explicit declarations ( 显 式 声明 )，209 一 210 
Explicit heap-dynamic variables ( 显 式 堆 动态 变量 )， 
217 一 218 
Explicit type conversion ( 显 式 类 型 转换 ) ，327 
Expressions (表达 式 ) 
arithmetic (算术 的 )，313 一 322 
associativity 《结合 性 ) 316~318 
Boolean (布尔 )，329 一 331 
coercion (绘制 转换 ) ，325 一 327 
conditional (条 件 的 ) ，319 
control (控制 )，346 
errors in (错误 ) 327~328 
lambda (lambda 表达 式 ) 651 
mixed-mode (混合 模式 )，325 
operand evaluation order (操作 数 求 值 顺序 ) ，319 一 321 
operator evaluation order (操作 符 求 值 顺序 )，313 一 318 
parentheses() ( 圆 括号 ) 318 
regular (正规 的 、 正 则 的 )，255 
relational (关系 的 )，328 一 329 
unambiguous grammars for (JEEE X PEX), 126~ 
127 
Expressivity (表达 式 )，16 
Extended accept clauses (扩展 的 accept 子 句 )，576 
Extended ALGOL (扩展 的 ALGOL 语言 ) ，7 
Extended BNF (EBNF) (扩展 的 巴 科 斯 一 一 诺尔 范式 )， 
131~134 
extends (reserved word) (保留 字 extends ) 427 
eXtensible HTML. (可 扩展 HTM 语 言 ) ， 另 见 XHML 
eXtensible Markup Language (XML) (可 扩展 标记 语言 )， 
108 
eXtensible Stylesheet Language Transformations (XSLT) 
(可 扩展 语言 转换 )，108 一 109 
Extensions (EBNF) (扩展 巴 科 斯 一 诺尔 范式 ) 131~134 
E 


Fact statements (Prolog) (Prolog 的 事实 语句 ) 694 
Farber, D.J, 76 

Feature multiplicity (特性 重复 性 ) 9 
Fetch-execute cycles ( 取 指 -执行 周期 )，21 


Fields (record) (记录 的 域 ) 283 
Fifth Generation Computing Systems (FGCS) (第 五 代 计 
算 机 系统 ) ，692 
Flies (header) (文件 (&)), 496 
Finalization (结束 化 ) 607 
finalize method (finalize 方 法 ) 531 
finally clause (finally 子 句 ) ，627 一 628 
final method (final 方 法 ) 531 
Finite automata (有 限 目 动机 )，171 
Finite mappings (有 限 映 射 ) 264 
First-order predicate calculus ( 先 序 谓词 演算 ) 685 
Fixed heap-dynamic arrays (固定 堆 动态 数 组 ) 266 
Fixed stack-dynarnic arrays (固定 栈 动态 数组 ) 265 
Flex (Flex 语 言 ) 92 
Floating-point datatypes ( 浮 点 数据 类 型 ) 250~251 
Floating-point hardware ( 浮 点 数 硬件 )，46 
float type (float 类 型 )，250 
FLOW-MATIC (FLOW-MATICi 语 言 )，63 
FLPL (Fortran List Processing Language) (Fortran 表 处 理 
Be), 52 
Formal parameters ( 形 参 ) 387 
Forms (形式 ) 
EBNF (Extended BNF) (扩展 的 巴 科 斯 -诺尔 范式 )， 
131~134 
names (名 字 )，203 一 204 
for statements (for 语 人 句 ) 
Ada, 360~361 
C-based languages (基于 C 的 语言 ) 361~363 
Python, 363 ~ 366 
Fortran, 46~5]1 
evaluation (?Ff{4t), 49~50 
HPF (High-Performance Fortran)，( 高 性 能 Fortran 话 
#), 593~ 594 
List Processing Language (FPLPL) ( 表 处 理 语言 ) 52 
Fortran 77，48 
Fortran 90，48 一 49 
Fortran 95, 13, 49 
Do statements (Doj#‘4)), 358 ~ 360 
named constants (命名 和 常量) 238 
Fortran 2003, 49 
Fortran II, 48 
Fortran IV, 48~49 
Fortran List Processing Language (FLPL) (Fortran 表 处 理 
BAB), 52 
Forward chaining (Prolog) (Prolog ij [rl #7), 697 
Fraction ranges (小 数 范 围 ) 251 
Free unions (自由 联合 ) 287 
Fully attributed trees (完全 属性 树 ) 136 
Fully qualified references (完全 限定 的 引用 ) ，285 
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Functional forms (aces), 645, 664~665 
Functional programming languages (KAEI iiie 
言 ) 642~643 
applications (应 用 )，675 一 676 
COMMON LISP (COMMON LISP 语 言 ) 666~667 
fundamentals of (基础 )，645 一 646 
Haskell (Haskell 语 言 ) 670~675 
and imperative languages (命令 式 语 言 ) 676~678 
LISP (LISP 语 言 ) 646~650 
mathematical functions (数学 国 数 ) 643~645 
ML (ML 语言 ) 667~670 
Scheme (Scheme 语言 ) 650~666 . 
Function composition ( 国 数 复合 ) 645, 664~665 
Functions ( 国 数 ) ，392 一 393 
building code (构造 代码 )，665 一 666 
defining Scheme functions (定义 Scheme 国 数 ) 651 
~ 653 
design issues (设计 问题 ) 429 
list functions in Scheme (Scheme Ay # iB), 650 
~ 651 
mathematical functions in Scheme (Scheme 中 的 数学 
rR), 650~651 
numeric predicate functions in Scheme (Scheme 中 的 
数值 谓词 图 数 ) 653 ~654 
pure virtual (4), 528 
return values (返回 值 )，429 一 430 
side effects (副作用 )，320，429 
Functors (KF), 685 


G 


GAMM (应 用 数学 与 力学 协会 ) 57 

Garbage (垃圾 ) 294 

Garbage collection (垃圾 收集 )，301 

Generality (一 般 性 、 通 用 性 ) 20 

General Purpose Simulation System (GPSS) (通用 目的 模 
拟 系统 ) ，25 

Generate and test (Prolog) (Prolog 的 产生 与 测试 ) ，709 

Generations (of languages) (语言 的 代 )，118 一 119 

Generic functions in C++ (C++ 的 通用 国 数 ) ，424 一 426 

Generic methods in C# 2005 (〈C# 的 通用 方法 ) 428~ 
429 

Generic methods in Java 5.0 (Java 5.0 的 通用 方法 ) 422 
~ 429 

Generic subprograms (通用 子 程序 ) 422~429 

Generic subprograms in Ada (Ada 中 的 通用 子 程序 )， 
422 一 424 

Generic units (通用 单元 ) 422 

Glennie, Alick E., 46 

Goals (Ht), 690, 696 


Goal statements (Prolog) (目标 语句 (Prolog)), 695 一 
696 
Gosling, James, 98, 622~623 
GPSS (通用 模拟 系统 ) 25 
Grammars (文法 ) 120 
ambiguity (歧义 性 )，124 一 125 
associativity of operators (操作 符 的 结合 性 ) 128~ 
130 
attribute (属性 ) 134~140 
context-free (上 下 文 无 关 文 法 ) 119~133 
derivations (派生 )，121 一 123 
operator precedence (操作 符 的 优先 级 )，125 ~ 128 
parse trees (语法 分 析 树 ) 123~124 
recognizers (识别 器 )，118 
unambiguous for expressions (KAJE A HE), 
126~ 127 
Graphical user interface. See GUI (图 形 用 户 接口 ) 
Graphs (state diagrams) (状态 图 )，171 
grep command (UNIX) (UNIX 系 统 的 grep 命 令 ) 15 
Griswoid, R.E., 76 ts 
Guarded commands (守卫 的 命令 ) 372~376 
Guards (守卫 )，564 
GUIDE (GUIDE 用 户 团体 ) 72 
GUI (graphical user interface) (图 形 用 户 接 口 ) 93 


H 


Handles, 177, 189 
Handling (处 理 ) 

events 事 件 ， 参 见 事 件 处 理 

exceptions (异常 ) 参见 异常 处 理 
Hansen, Per Brinch, 569 
Hardware (floating-point) ( 浮 点 数 硬件 )，46 
Hashes ( 散 列 )，84，283 
Haskell (Haskell 语 言 ) 56, 670~678 
Header files ( 头 文件 ) 496 
Heap-dynamic arrays ( 堆 动 态 数 组 ) 266 
Heap-dynamic variables ( 堆 动态 变量 )，291 
Heaps ( 堆 )，291 

management (管理 ) 300~304 
Heavyweight tasks (重型 任务 ) 560 
Hejisberg, Anders, 97, 105 
High-Order Language Working Group (HOLWG) (高 阶 

语言 工作 组 ) 88 
High-Performance Fortran (HPF) (高 性 能 Fortran 语 言 ) ， 
593 ~ 594 

Historical background (历史 背景 ) 

of Ada, 87~88 

of Algol 60, 56~57 

of C, 81~82 

of COBOL, 63 


502 


of Fortran, 46~47 
of Perl, 83~84 
of Plankalkiil, 42 
6f PLA. R2 
History-sensitive (历史 敏感 的 ) 215, 395 
Hoare, C.A.R- ("Tony"), 15, 25, 79 
HOLWG (High-Order Language Working Group) (高 阶 
语言 工作 组 )，88 
Hopper, Grace, 45, 63 
Horn clauses ( 霍 因 子 句 ) ，690 
HPF (High-Performance Fortran), 593 ~594 
Hybrid implementation systems (EAH RMA), 31 
~ 32 
Hypotheses (假设 ) 690 


IAL (International Algorithmic Language) (国际 算法 语 
B), 58 
IBM 704, 46, 47, 344 
IBM Hursley Laboratory (England) (位 于 英国 的 IBM 
Hursley 实 验 室 ) 73 
IBM mainframe computers (IBM 大 型 计算 机 )，10，72 
Identifiers (标识 符 )，14 
Identity operators (标识 操作 符 )，314 
IEEE floating-point formats (IEEE 浮 点 数 格式 )，251 
IFIP (International Federation of Information Processing) 
(国际 信息 处 理 联合 会 )，79 
Imperative languages (命令 式 语 言 )，20 
Implementation (I), 26~33 
of array types (数组 类 型 的 ) ，273 一 280 
of associative arrays (相关 数组 的 ) 282 
of character string types (字符 串 类 型 的 )，257 一 258 
compilation (441%), 27~30 
hybrid (混合 的 ) 31~32 
of Java (Java 语 言 的 ) 32 
of object-oriented constructs (面向 对 象 结构 的 ) 547 
~ 550 
of parameters (参数 的 ) 405~406 
of pointers (指针 的 ) ，299 一 304 
preprocessors ( 预 处理 器 ) 33 
pure interpretation (4f), 30~31 
of record types (记录 类 型 的 )，286 
of references (5|FHAY), 299~304 
of state diagrams (##AS FSAI), 171~175 
of subprograms ( 子 程序 的 ) 440~464. 参照 子 程序 
of union types (联合 类 型 的 ) 290 
of user-defined ordinal types (用 户 定义 序数 类 型 的 )， 
203 
Implicit declarations (KH), 209~210 


索 žl 


Implicit heap-dynamic variables ( 隐 式 堆 动态 变量 )， 
218~219 
import declaration (import 声 明 ) 501 
#include, 33 
Incremental mark-sweep, 303 
Indexes (arrays) (数组 下 标 ) 264~265 
Inference rules (推理 规则 )，144 
Inferencing (推理 ) ，696 一 699 
Infix (binary operators) (Infix 二 元 操作 符 )，313 
Information hiding (信息 隐藏 ) 
Ada,475 ~ 177 
C++, 483 
Information Processing Language I (IPL-I) (信息 处 理 话 
BI), 51 
Inheritance (继承 ) 
Ada 95, 536~537 
C#, 534 
C++,519~526 
Java, 531~532 
object-oriented programming (OOP) 509~510 
Ruby, 542~543 
Smalltalk, 518 
Inherited attributes (继承 属性 ) 135 
Initialization (初始 化 )，238 一 239 
of array types (数组 类 型 的 )，268 一 269 
In mode semantic model (输入 型 语义 模型 ) 397 
Inout mode semantic model (输入 输出 型 语义 模型 ) ， 
397 
Instance data storage (实例 数据 存储 ) ，547 
Instance methods (实例 方法 )，510 
Instance variables (实例 变量 )，510 
Instantiation (实例 化 )，689，693 
Integers (整数 )，250 
Interfaces (Java) (Java 语 言 的 接口 )，531 一 532 
International Algorithmic Language (IAL) (国际 算法 语 
BH), 58 
International Conference on Information Processing ( 国 
际 信息 处 理会 议 )，59 
International Federation of Information Processing (IFIP) 
(国际 信息 处 理 联 合 会 ) 79 
International Standards Organization (ISO) (国际 标准 组 
24), 101 
Interpreters (解释 器 ) 
LISP, 648~650 
Scheme, 650 
Interrupt (中 断 ) 585 
Intrinsic attributes (内 在 属性 )，136 
Intrinsic limitations (Prolog) (Prolog 语 言 的 内 在 限制 )， 
713 
int type (int 类 型 )，250 


x zl 


IPL (信息 处 理 语 言 ) 51 
ISO (International Standards Organization) (国际 标准 组 
24), 101 

IT, 36 

Iteration (s&ft) 
based on data structures (4 F% kJ), 369~371 
constructs (445), 357 

Iterative statements (迭代 语句 ) ，356 一 371 
Ada, 360~ 361 
C-based languages (基于 C 的 语言 ) 361 ~363 
Fortran 95, 358 ~360 
Python, 363 ~366 

Iterators (4%), 369 

Iverson, Kenneth E., 75 


J 


Jagged arrays (参差 的 数组 ) 271 
Java _ (Java 语言 ) 22, 97~101 
abstract data types (抽象 数组 类 型 ) 485~486 
dynamic binding (动态 绑 定 ) 532~533 
evaluation of support for OOP (支持 OOP 的 评估 ) ， 
533 
event handling (事件 处 理 ) 631 ~636 
event listeners (事件 监听 器 ) 632 
exception handling (异常 处 理 )，620 ~ 630 
generic methods in (通用 方法 ) 426~428 
GUI components (GUI 组 件 )，631 一 632 
implementation (实现 ) ，32 
inheritance (继承 ) 531~532 
interfaces (#20), 531~532 
named constants (命名 常量 )，238 
names (名 字 )，204 
nested classes (#R 22K), 533 
obiect-oriented programing (support for) (支持 OOP)， 
530 ~ 533 
packages (#3), 500~501 
Swing package (Swing 包 )，631 ° 
threads (线程 ) 583 ~ 590 
JavaScript, 101 ~ 103 
objects (Xt), 544~545 
object model of (对 象 模型 ) 543~547 
Java Server Pages (JSP) (Java 服 务 器 网 页 ) 109~110 
Java Server Pages Standard Tag Library (JSTL) (Java 服 
F ax A Hl antic BAP), 109 
Java Virtual Machine (JVM) (Java 虚 拟 机 )，99 
JIT (Just In Time) compilers (适时 编译 器 ) 99, 169 
JOVIAL (Jules 国 际 代 数 语 言 ) 59 
JScript, 101 
JSP (Java Server Pages) (Java 服 务 器 网 页 )，109~110 
JSTL (Java Server Pages Standard Tag Library) (Java 服 


503 


务 器 网 页 标准 标记 程序 库 ) 109~ 110 
Justin Time. (适时 编译 器 ， 参 见 JIT ) 
JVM (Java Virtual Machine) (Java 虎 拟 机 )，99，587 


K 


Kay, Alan, 92 

Kemeny, John, 67 

Kernighan, Brian, 83 

Keys (关键 码 )，281 

Keyword parameters (关键 字 参 数 ) ，388 
Keywords (关键 字 )，70，204 一 205 
Korn, David, 83 

Kowalski, Robert, 86 

Knuth, Donald, 191, 379 

Kurtz, Thomas, 67 


L 


Lambda expressions (Lambda 表 达 式 ) 644, 651 
Laning and Zierler system, 46 
Languages (语言 ， 参 见 特殊 语言 ) 

Ada, 87~91 

Ada 95, 91 

AIMACO, 63 

ALGOL 58, 58~59 

ALGOL 60, 5, 59~60 

ALGOL 68, 77~79 


ALGOL-W, 79 
APL, 75~76 
APT, 25 

awk, 83 

B, 81 


BASIC, 12, 67~69 

BASIC-PLUS, 68 

BEPL, 81 

BLISS, 7 

block-structured ( 块 结 构 的 ) 238 
C, 81~83 

C89, 82 

C99, 82 

C#, 105~108 

C++, 94~97 

categories of (F), 24~25 
C-based (基于 C 的 )，202 

CBL, 63 

COBOL, 6, 62~67 

COMMON LISP, 55, 666 ~ 667 
Delphi, 97 

Eiffel, 96 ~ 97 

evaluation criteria (PHEN), 7~20 
evolution. (演化 ， 参 见 语言 的 演化 ) 


504 


Flex, 92 

FLOW-MATIC, 63 

Fortran, 46~ 51 

functional programming (函数 式 程序 设计 )，645 一 
646， 参 见 函 数 式 程序 设计 语言 

genealogy of (KIF), 41 

generators (Æ), 118~119 

GPSS, 25 

Haskell, 56, 670 ~ 678 | 

IAL (International Algorithmic Language) (国际 算法 
语言 )，58 

imperative (命令 式 的 )，20 


Java, 97~101 
JavaScript, 101 ~ 103 
JOVIAL, 59 
JScript, 101 

JSP, 109~110 

ksh, 83 

LISP, 51~55 


LiveScript, 101 

logic programming. (逻辑 程序 设计 ， 参 见 逻 辑 程 序 设 
计 语 言 ) 

LOGO, 92 

MAD, 59 

markup/programing hybrids,24，( 标 记 / 程 序 设 计 复 合 ) 
108~110 

MATH-MATIC, 56 

metalanguages (元 语言 ) 120 

Miranda, 56 

ML (元 语言 ) 56, 667~670 

NELIAC, 59 

NPL, 73 

orthogonality (E3 E), 10~12 

parameter-passing methods for (参数 传递 方法 ) 400 
~ 405 

Pascal, 79~81 

Perl, 83~85 

PHP, 103 

Plankalkiil, 40~43 

PL/C, 74 

PL/1, 72~75 

Prolog, 6, 85~87 

Prolog++, 87 

pseudocodes (虚拟 码 ) ，43 一 46 

Python, 104 

readability (可 读 性 )，8 一 15 

reasons for studying (学 习 的 缘由 ),，2~5 

recognizers (识别 器 )，118 





regular (正规 的 、 正 则 的 )，171 
RPG, 25 
Ruby, 104~ 105 
Scheme, 6, 55 
scripting (#IA{t), 101~ 105 
selection of (选择 )，3 
simplicity (fajMvE), 9~10 
SIMULA 67, 76~77 
SIMULAI, 76 
SmallTalk, 91 ~ 94 
SNOBOL, 75~76 
sotirce lanquage ( 源 语言 ) 28 
SQL (Structured Query Language) (结构 查询 语言 ) ， 
714 
strongly typed ( 强 类 型 的 ) 219~221 
syntax (语法 )，14 一 15 
Tcl, 83 
trade-offs (权衡 ) ，25 一 26 
VDL (Vienna Definition Language) (Vienna 定 义 话 
言 ) 142 
visual (可 视 的 ) 24 
Visual BASIC, 69 
writability ("J 51), 15~16 
XSLT, 108~ 109 
Laning and Zierler system (Laning 和 Zierler 系 统 ) 46, 
56 
Lazy approach (懒惰 方法 ) 301 
Lazy evaluation (懒惰 求 值 ) 674 
LCF (Logic for Computable Functions) (可 计算 函数 逻 
辑 ) 56 
Leaf nodes (intrinsic attributes) (内 部 属性 的 叶 节 点 ) ， 
136 
Learning new languages (学 习 新 语言 ) 3~4 
Left factoring (提取 左 因 子 ) 187 
Left-hand side (LHS) (左手 边 ) 120 
Leftmost derivations (最 左派 生 ) 122 
Left recursive rules ( 左 递归 规则 )，129，184 
Length (string options) (HEE RE), 256 
Lerdorf, Rasmus, 103, 276~278 
Level numbers (of records) (记录 的 层 号 ) 283 
Lexemes (词素 ) 117, 170 
Lexical analysis (词法 分 析 )，169 一 175 
Lexical anaiyzers (词法 分 析 器 ) 28, 169~175 
LHS (left-hand side) (左手 边 ) 120 
Lifetime of variables (变量 的 生存 期 )，215，234 
Lightweight tasks ( 轻 量 任务 )，560 
Limited dynamic length strings (有 限 动态 长 度 串 )， 
256 
Limited private types ( 受 限 私有 类 型 )，477 


x zl 


505 





Linkage (subprograms) ( 子 程序 的 链接 ) 440 
Linkers (链接 器 ) 443 
Linking (链接 ) 30, 443 
lint program (UNIX) (UNIX 的 lint 程 序 ) 17 
LISP (LISP 语 言 ), 6, 51~55 
COMMON LISP, 55~56, 666~667 
data structures (数据 结构 )，$2 一 53，647 一 648 
data types (数据 类 型 ) 647~648 
of evaluation (评估 的 )，54 
interpreters (解释 器 )，648 ~650 
overview of (概述 )，52 一 54 
syntax (E), 53~54 
List assignments (链表 赋值 ) 336 ~337 
List comprehensions (链表 综合 ) 672~673 
Lists (链表 ) 
simple (简单 ) 647 
structures (Prolog) (Prologi# 3 Ay ft #44), 702~ 
707 
Literals (overloaded) ( 重 载 的 字面 常量 )，260 
Liveness (741), 562 
LiveScript, 101 
LL grammar class (LL 文法 类 ),，177，184 一 187 
Loading (加 载 )，30，443 
Load modules (加 载 模块 )，30 
Local_offset (局 部 偏 移 ) 447 
Local referencing environments (局 部 引用 环境 ) 395~ 
397 
Local variables ( 局 部 变量 ) 395 
Locks-and-keys approach ( 锁 与 钥匙 的 方式 )，299 一 
300 | 
Logical concurrency (逻辑 并 发 )，558 
Logically controlled loops ( 钦 辑 控制 循环 )，366 ~ 368 
Logical Theorist (逻辑 理论 家 )，51 
Logic for Computable Functions (LCF) (可 计算 函数 的 逻 
辑 )，56 
Logic programming overview (逻辑 程序 设计 概述 )，690 
一 092 
Logic programming languages (逻辑 程序 设计 语言 ) 24, 
684 
applications (应 用 )，713~716 
predicate calculus (谓词 演算 ) 684~688 
programming (程序 设计 )，690 一 692 
Prolog, 693~713 
LOGO (LOGORE Z), 92 
Loop invariants (/@AAAws), 149~150 
Loop parameters (循环 参数 ) 357 | 
Loops (循环 )，352 
axiomatic semantics (公理 语义 )，149 一 152 
based on data structures (基于 数据 结构 )，369 一 371 


counter-controlled (计数 器 控制 的 )，3S$7 一 366 
denotational semantics (指称 语义 ) 160 
logically contro''ed (逻辑 控制 )，366 一 368 
user-located controiled mechanisms (用 户 定 位 的 循环 
控制 机 制 )，368 一 369 
Loop variables (循环 变量 )，357 
Lost heap-dynamic variables (丢失 的 堆 动态 变量 ) af 
294 ~ 295 
LR parsing algorithms (LR 语 法 分 析 算 法 ) 191~195 
L-value ( 左 值 )，206 
M 


Macros ( 宏 指 令 )，33 
MAD language (MAD 语 言 ) 59 
Management of heaps ( 扒 管 理 ) 300~305 
Manifest constants (说 明 常 量 )，238 
Mark-sweep (标记 -清除 法 ) 301 
Markup/programing hybrid languages (标记 /程序 设计 复 
合 语言 ) 108~110 
Matching (Prolog) (Prolog 语 言 的 匹配 ) ，697 
Mathematical functions (数学 国 数 ) 643~645 
MATH-MATIC, 56 
Matstimoto, Y., 104 
Mauchly, John, 44 
McCarthy, John, 6, 52, 648 
McCraken, Daniel, 25 
Member functions (成 员 畏 数 ) 482 
Memory leakage (Wiii), 99, 295 
Message interface (消息 接口 )，509 
Message passing (concurrency) (并 发 的 消息 传递 )，570 
~ 583 
Message protocol (消息 协议 ) 509 
Messages (消息 )，509 
Meta Language (ML) (元 语言 ) 56 
Metalanguages (元 语言 ) 120 
Metasymbols (元 符号 ) 132 
Methodologies of software design (软件 设计 方法 学 ) ， 
22 一 23 
Methods (方法 ) 509 
abstract (抽象 ) 510 
class (%), 510 
of describing semantics (HREH), 140~161 
of describing syntax (HREH), 117~134 
dynamic binding (动态 绑 定 ) 576 
final (final 语 句 ) 531 
finalize (finalize 语 句 )，531 
instance (实例 )，510 
overriding (7##), 510 
parameter-passing (参数 传递 ) 387~405 
prototype (原型 、 样 机 )，410 


506 


Meyer, Bertrand, 96 

Milner, Robin, 56 

MIMD (Multiple-Instruction Multiple-Data) (多 指令 多 数 
据 )，557 

Minsky, Marvin, 52 

MIT ( 麻 省 理工 学 院 )，52，55 

Mixed-mode assignment (混合 模式 赋值 )，337 一 338 

Mixed-mode expressions (混合 模式 表达 式 )，325 

ML, 56, 211, 214, 667~670 

Models, tracing 〈 模 型， 跟踪) 701 

Modifiers (修饰 符 ) 

access (C#) (C# 的 存 取 )，486 
unsafe, 298 

mod operator (Ada) ( 取 模 操作 符 )，315 

Modules (Ruby), 502 ~ 503 

Modules (load), 30 

Monitors ( 管 程 )，$68 一 570 

evaluation of (PF{h), 569~570 

Multidimensional arrays as parameters (多 维 数 组 作为 参 
Br), 411~415 

Multiple inheritance (多 继承 ) 510, 514~515 

Multiple-Instruction Multipie-Data (MIMD) (多 指令 多 数 
据 ) 557 

Multiple selection constructs (多 选择 结构 )，350 一 356 

Multiprocessor architectures (多 处 理 器 体系 结构 )， 557 
~558 

Multithreaded (多 线程 )，558 


N 


Named constants (命名 常量 )，236 一 238 
Names (£4, ), 203~205 

design issues (设计 问题 ) 203 

encapsulation (#4#), 498~503 

forms (形式 ) 203~204 

patterns (#30), 169~ 170 

variables (4), 206 
Namespaces (C++) (C++ 的 命名 空间 ) 499 ~ 500 
Name type equivalence (名 字 类 型 等 价 性 ) 221 
Naming encapsulations (命名 封装 )，498 一 503 
“Ada，501 一 S02 

C++, 499~500 

Java, 500~501 

Ruby, 502~503 
Narrowing conversion ( 罕 化 转换 )，324 
National Physical Laboratory (England) (英国 国家 物理 

实验 室 )，73 
Natural language processing (Prolog) (Prolog 的 自然 语言 
处 理 ) ，715 

Natural operational semantics (自然 操作 语义 )，141 
Naur, Peter, 59~60, 119. 参见 BNF (Backus-Naur 


form) 
Negation problem (Prolog) (Prologh GÆ), 711~ 
713 
NELIAC (NELIAC 语 言 ) 59 
Nested classes ({x,#2E), 516 
C#, 535 
Java, 533 
Nested subprograms (WETE), 347, 495 
implementing (实现 ) 451~459 
Nesting-depth (FREE), 454 
Nesting selectors (WEZH), 347~350 
Netscape (Netscape 搜 索引 擎 ) 101 
Newell, Alan, 51 
new method (new 方 法 ) 534 
New Programming Language (NPL) (NPL 语 言 ) 73 
Nonstrict ( 非 限制 )，673 
Nonterminal symbols ( 非 终 结 符 )，120 
Notation (符号 ) 
dot (点 )，284 
two complement (两 相互 补 )，250 
NPL (New Programming Language) (NPL 语 言 ) 73 
Numbers (level) (层次 的 数目 ) 283 
Numeric types (XUR iA), 249~252 
Nygaard, Kristen, 76 


O 


Object-oriented programming (OOP), 93, 94~97, 
508 ~ 511 
Ada 95 (support for) (支持 Ada 95), 535~540 
C# (support for) (支持 C#) 533 
C++ (support for) (*%F#C++), 519~530 
design issues (设计 问题 )，$12 一 5$16 
dynamic binding (动态 绑 定 ) 511 
inheritance (4k7K), 509~510 
JavaScript (object model of) (Java Script 语言 的 面向 
对 象 模型 ) ，$43 一 5$47 
Java (support for) (支持 Java) ，$30 一 5$33 
Ruby (support for) (支持 Ruby) ，5$40 一 543 
Smalltalk (support for) (支持 Smalltalk) ，516 一 518 
Objects (对 象 ) 249, 471, 509 
allocation of (4742), 515~516 
deallocation of (Jc), 515~516 
exclusivity of (GH JR), 512 
JavaScript, 543~547 
protected (Ada 95) (Rd), 580~581 
Operands (evaluation order) (操作 数 求 值 n 顺 序 ) 319 ~ 
322 
Operating systems (UNIX) (UNIX 操 作 系 统 )，7 
Operational semantics , 141~142 
evaluation (操作 语义 )，142 


索 zl 


507 





Operator overloading (操作 符 重 载 )，9 
Operator precedence (操作 符 优 先 级 )，125 
rules (规则 )，314 
Operators (操作 符 ) 
APL, 317 
associativity (GAPE), 317~318 
binary (二 元 的 )，313 
C++, 102 | 
compound assignment (复合 赋值 )，333 一 334 
evaluation order ( 求 值 顺序 )，313 一 319 
identity (标识 ) ，314 
infix (Fa), 313 
overloading (Æ$), 322~324, 430~43] 
parentheses ( 圆 括号 ) 318 
precedence (优先 级 ) 314~315 
relational (关系 的 ) 328 
rem (Ada) (Ada 语 言 的 rem 操 作 符 ) 315 
Ruby, 318~319 
ternary (三 元 的 )，313 
unary (一 元 的 )，313 
unary assignment (一 元 赋值 )，334 一 335 
user-defined overloaded (用 户 定义 重 载 )，322，324， 
420 
Optimization (优化 ) 19 
Ordinal types (序数 类 型 ) ，258 一 263 
Origins of Backus-Naur form ( 巴 科 斯 -诺尔 范式 的 起 源 )， 
119~120 
Or-else, 332 
Orthogonality (EZ), 10~12 
others clause (others 子 句 ) 269 
Ousterhout, John, 83 
Out mode semantic model (语义 模型 的 输出 型 )，397 
Overflow (#7, HEH), 328 
Overloaded literals ( 重 载 文字 常量 ) 260 
Overloaded subprograms ( 重 载 子 程序 ) 394, 420~ 
422 
Overloading operators (ERREZ), 322~324, 430~ 
431 
override ($), 534 
Overriding methods (覆盖 方法 ) 510 


P 


Packages (4) 
Ada,475 ~ 486,500 ~ 502 
Child (Ada 95) (Ada 95 语 言 的 子 包 ) 538~539 
Java, 500~501 
Swing, 631 
Pairwise disjointness tests (两 两 不 相交 测试 )，186 
Papert, Seymour, 92 


Parameter-passing methods (参数 传递 方法 )，400 一 405 
Parameter profiles (参数 描绘 ) 386 
Parameterized abstract data types，490 一 495 
Ada，491 一 492 
C# 2005, 494~495 
C++, 492~494 
Java, 493~494 
Parameters (参数 ) 387~391 
actual ( 实 参 ) 388 
formal ( 形 参 ) ，387 
keyword (关键 字 )，388 
multidimensional arrays as (多 维 数组 )，411 一 415 
pass-by-copy ( 按 复制 传递 ) 403 
pass-by-name ( 按 名 传递 )，404 一 405 
pass-by-reference ( 按 引 用 传递 ) ，403 一 404 
pass-by-result ( 按 结果 传递 ) 402~403 
pass-by-value ( 按 值 传递 ) 400~401 
pass-by-value-result ( 按 值 和 结果 传递 )，403 一 404 
positional (位 置 的 ) 388 
subprograms ( 子 程序 ) ，418 一 420 
type-checking (类 型 检测 ) ，409 一 411 
Parametric polymorphism (#442), 422 
params reserved word (C#) (C# 语 言 中 的 保留 字 
params), 389~390 
Parent classes (402K), 509 
Parentheses ( ) ( 圆 括 号 )，318 
Parse trees (语法 分 析 树 ) 28, 123~124 
if-then-else statement unambiguous grammars 
(it-then-else 语 句 非 歧义 性 文法 ) 131 
Parsing (语法 分 析 ) 
bottom-up parsers ( 自 底 向 上 语法 分 析 器 )，176，177 
~178, 188~195 
complexity of (复杂 性 ) 178 
LL algorithms (LLX: ), 177 
LR algorithms (LR), 191~195 
overview of (概述 ) ，175 一 176 
recursive-descent (%19 F), 177, 179~184 
top-down parsers ( 自 顶 向 下 语法 分 析 器 ) 176~177 
traces (追踪 )，182 一 183，195 
Partial correctness (部 分 正确 性 ) 152 
Pascal, 79~81 
Pascal, Blaise, 79 
Pass-by-copy parameters ( 按 复制 传递 参数 ) 403 
Pass-by-name parameters ( 按 名 传递 参数 ) 404~405 
Pass-by-reference parameters ( 按 引 用 传递 参数 ) ，403 
一 404 
Pass-by-result parameters ( 按 结 果 传 递 参数 ) 391 ~ 392 
Pass-by-value parameters ( 按 值 传递 参数 )，400 一 401 
Pass-by-value-result parameters ( 按 值 和 结果 传递 参数 ) ， 
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403 ~ 404 Java threads (concurrency) (并 发 的 Java 线 程 )，586 
Patterns (lexical analysis) (词法 分 析 的 模式 ) ，169 一 170 Private types (私有 类 型 ) 476 
PDA (pushdown automata) (下 推 自动 机 )，190 Procedures (subprograms) ( 子 程序 的 过 程 )，392 ~393 
PDP-11 minicomputers (PDP-11 型 微型 计算 机 )，68 Process abstraction (过 程 抽 象 )，470 
Perl, 3, 83~85 Processes (过 程 ) 559 
Perlis, Alan, 50, 56 Processors, vector (处 理 器 ， 矢 量 )，5$57 
PHP，103 Producer-consumer problem (生产 者 -消费 者 问题 )， 
Phrases (短语 )，189 560 
Physical concurrency (物理 并 发 )，558 Program proofs (程序 证 明 )，15$2 一 155 
Plankalkiil, 40~43, 58, 64 Program counters (程序 计数 器 ) 21 
PL/C, 74 Programming (程序 设计 ) 
PL/CS, 74 domains (领域 )，5 一 7 
PL/I, 72~75 data oriented (jij [aj Ace), 23 
operational semantics (操作 语义 )，142 environments (环境 )，33 一 34 
PL/S, 6 object-oriented ( 面 加 对象) 23, 97 
Pointers (指针 )，291 一 304 procedure oriented (面向 过 程 )，23 
Ada, 295 systems (AM), 6 
C, 295~297 Programming languages. 参见 语言 程序 设计 语言 
C++, 295~297 genealogy of (家 谱 )，41 
dangling (悬挂 ) 293~294 methodologies (方法 学 ) 22~23 
design issues (设计 和 问题 )，292 reasons for studying (学 习 的 缘由 ),，2~5 
evaluation (评估 )，298 一 299 selection of (选择 )，3 
implementation (实现 ) ，299 一 304 Programs (See also Applications) (程序 ， 另 见 应 用 ) 
operations (操作 ) 292~293 state of (状态 ) 158 
problems (问题 ) ，293 一 295 Prolog (Prolog 语 言 ) 6, 85~87 
Polenky, F.P, 76 closed-world assumptions (4th A(Riz), 710~ 
Polymorphic references (多 态 引 用 )，511 711 
Polymorphic subprograms (多 态 子 程序 ) 422 deficiencies (缺陷 )，707 一 713 
Polymorphism (多 态 性 )，422 expert systems (专家 系统 ) ，714 一 715 
parametric (参数 的 ) ，422 fact statements (事实 语句 ) 694 
type checking and (类 型 检测 ) 513~514 inferencing (推理 ) 696~ 699 
Portability (可 移植 性 )，19 intrinsic limitations (内 在 限制 )，713 
Positional parameters (位 置 参数 )，388 natural language processing (自然 语言 处 理 )，715 
Postconditions (后 置 条 件 )，143 negation problem (人 否定 问题 )，711 一 713 
Posttests (loops) (循环 的 后 测试 ) 357 origins (起 源 ) 692 
pragma (Ada), 613 resolution order control (归结 次 序 控 制 )，707 一 710 
Precedence (优先 级 ) terms (术语 )，693 
Boolean operators (布尔 操作 符 )，329 ~ 330 Prolog++，87 
operators (操作 符 ) ，314 一 315 Proof (program) (程序 证 明 )，15$2 一 155 
Precision (values) (精度 值 ) 251 Properties (属性 )，487 
Preconditions (前 置 条 件 )，143 Propositions (命题 ) 684, 685~ 687 
weakest (最 弱 的 ) 144 atomic (原子 命题 ) ，685 
Predicate calculus (谓词 演算 )，688 一 690 protected internal, 486 
Predicate functions (谓词 函数 ) 135 Protected objects (Ada) (Ada 的 保护 对 象 ) ，$80 一 581 
Preprocessor ( 预 处 理 器 ) ,， 33 Protocols (subprograms) ( 子 程序 协议 ) 386 
Pretests (loops) (循环 的 先 测 试 ) 357 Prototype methods (原型 方法 ) ，410 
Primitive datatypes (基本 数据 类 型 ) 249~253 Prototypes (原型 ) ，387 
Priorities (优先 级 ) Proving theorems (定理 证 明 ) 688~690 


Ada (concurrency) (并 发 的 Ada 语 言 )，$79 一 5$80 Pseudocode (WEALD. 414E), 43~46 
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Short Code (得 代码 )，44 一 45 

Speedcoding (快速 编码 ) ，45 
Pure interpretation ( 纯 解 释 )，30 一 31 
Pure virtual functions ( 纯 虚 函数 )，528 
Pushdown automata (PDA) (下 推 自 动机 )，190 
Python, 104 


Q 


Quasi-concurrency (EJH £), 431, 558 
Quasi-concurrent coroutines ( 准 并 发 协同 程序 ) 558 
Queries (查询 )，686 

R 


Race conditions ( 竞 态 条 件 )，561 
Raised exceptions (产生 的 异常 )，603 
Rand Corporation Jonniac computer (Rand 公 司 的 Jonniac 
计算 机 )，51 
Ranges ( 值 域 )，251 
RDBMSs (relational database management systems) ( 关 
系数 据 库 管 理 系统 )，714 
Readability (可 读 性 )，8 一 9 
conflicts (H), 25 
reliability (可 靠 性 )，18 
Recognizers (grammars) (识别 器 )，134 
Recognition (of languages) (语言 识别 )，118 
Records (记录 ) 
activation ( 启动、 激活 )，441 
CIR (class instance record) (类 实例 记录 )，547 
definitions of (定义 )，283 一 284 
evaluation of (评估 )，286 
implementation (实现 )，286 
operations on (操作 )，285 一 286 
references (引用 )，284 一 285 
Record types (记录 类 型 ) 282~286 
Rectangular arrays (长 方 数 组 ) 271 
Recursion, implementing (实现 递归 )，448 一 450 
Recursive-descent parsing (递归 下 降 语法 分 析 ) 177, 
179 ~ 184 
Recursive rules (递归 规则 )，121 
Reference variables (引用 变量 )，291 
References (引用 ) ，297 一 298 
counters (计数 器 ) 301 
elliptical (省 略 )，285 
evaluation of (评估 )，298 一 299 
fully qualified (完全 限定 的 ) 285 
implementation (实现 ) 299~304 
polymorphic (425A), 571 
to record fields (记录 域 ) 284~285 
substring ( 子 串 ) 253 
Referencing environments (引用 环境 ) 234~236 
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Referential transparency (引用 透明 性 ) ，321 一 322，646 
Regular expressions (正则 表达 式 )，255 
Regular languages (正则 语言 )，171 
Relational database management systems (RDBMSs) ( 关 
系数 据 库 管理 系统 )，714 
Relational expressions (关系 表达 式 )，328 一 329 
Reliability (可 靠 性 ) ，17 一 18 
aliasing (别名 使 用 )，18 
exception handling (异常 处 理 )，17 
readability (可 读 性 )，18 
type checking (类 型 检测 )，17 
writability (可 写 性 )，18 | 
rem operator (Ada) (Ada 语 言 的 rem 操 作 符 ) 315 
Reports (报告 ) 
ALGOL 58, 59 
ALGOL 60, 60 
Representations of references and pointers (引用 和 指针 
的 表示 )，299 
Research Laboratory for Electronics (电子 实现 室 )，52 
Reserved words (保留 字 )，14，205 
Resolution ( 上 妥 结 ) 688 
Resolution order control (Prolog) (Prolog 语 言 的 归结 次 
FFI Hill), 707~710 
Resumes (coroutines) (重新 启动 协同 程序 ) ，431 
Resumption (重新 启动 )，606 
Returned values (types of) (返回 值 类 型 ) 429~430 
Returns (semantics for) (返回 语义 ) 441 
RHS (right-hand side) (右边 ) 120 
Richards, Martin, 81 
Right-hand side (RHS) (右边 ) 120 
Rightmost derivation (最 右派 生 )，122 
Right recursive rules ( 右 递 归 规 则 )，129 
Ritchie, Dennis, 82 
Roussel, Phillippe, 86, 692 
Row major order ( 按 行 存储 )，274 
RPG, 25 
Ruby, 104~ 105 
abstract data types (抽象 数据 类 型 )，488 一 490 
blocks ( 块 )，391 一 392 
dynamic binding (动态 绑 定 ) 543 
evaluation of support for OOP (支持 OOP 的 评估 )， 
543 
inheritance (4k7#K), 542~543 
modules ($), 502~503 
support for OOP (支持 OOP) ，5$40 一 5$43 
Rule of consequence (后 果 规 则 )，146 
Rules (规则 ) 
associativity (结合 性 ) ，316 一 318 
inference (推理 ) 144 
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left recursive ( 左 递归 ) ，129 
operator precedence (操作 符 优 先 级 )，314 一 315 
recursive (3619), 129 
resolution (44), 688 
right recursive (#313), 129 
rule of consequence (后 果 规 则 )，146 
statements (Prolog) (Prolog 的 语句 ) ，694 一 695 
Run-time stacks (运行 时 栈 )，445 
resume (重新 开始 )，431 
Russel, S.B., 649 
Rutishauser, H., 61 
r-value ( 右 值 )，207 


S 


Sammet, Jean, 110 
Schedulers (调度 程序 ) 561 
Scheme, 6, 55, 650~666 
control flow (控制 流 ) ，654 一 655 
interpreters (解释 器 ) 650 
predicate functions (谓词 图 数 ) 658~659 
list functions (HR HAL), 655~658 i 
Schwartz, Jules 1., 59 
Scientific applications, 5 
Scope (of variables) (变量 的 作用 域 ) 225~233 
blocks ( 块 ) 227~229 
dynamic scope (动态 作用 域 ) 232~233 
(and) lifetime (生存 期 、 寿 命 ) 234 
static scope (静态 作用 域 ) 225~231 
Scripting languages (脚本 语言 ) 101~105 
Scripts (脚本 ) 83 
Selection of languages (语言 选择 )，3 
Selection statements (选择 语句 ) 346~356 
multiple (多 )，350 一 356 
two-way (Xil), 346~350 
Selectors (nesting) (REAA ), 347~350 
Semantics (£X), 116~117 
axiomatic (公理 ) 143~155 
for calls and returns (用 于 调用 与 返回 ) 441 
declarative (说 明 )，690 
denotational semantics (4§9#RiZ X), 155~161 
dynamic (动态 的 ) 140~ 161 
operational (€), 141~142 
static (静态 的 )，134 一 135 
Semaphores (信号 量 )，563 一 568 
binary (二 元 ) ，567 
evaluation of (评估 )，568 
Sentences (人 句子) 117 
Sentential forms (名 型 ) 122 
Sequences (axiomatic semantics) (公理 语义 序列 ) ，147 
~ 148 


Server tasks (服务 器 任务 ) 573 
Servlet container (Servlet 容 器 ) 109 
Shallow access (ijinl), ，463 一 464 
Shallow binding (小 绑 定 ) 419 
SHARE (computer user group) (SHARE 计 算 机 用 户 组 
20), 57,59,72,73 
Shared inheritance (共享 继承 ) 514 
Shaw, I. C.; 31 
Shift-reduce algorithms ( 移 进 -- 归 约 算法 ) ，190 一 195 
Short-circuit evaluation (短路 求 值 ) 331~332 
Short Code (得 代码 ) ，44 一 45 
Short Range Committee ( 短 范 围 委 员 会 ) 64 
Side effects (functions) ( 国 数 的 副作用 ) ，320 
Signatures (44%), 386 
SIMD (Single-Instruction Multiple-Data) ( 单 指令 多 数 
W) 557 
Simon, Herbert, 51 
Simple assignment statements (简单 赋值 语句 ) 333 
Simple lists (简单 链表 ) ，647 
Simple phrases (人 简单 短语 ) 189 
Simplicity (tE), 9~10 
orthogonality (EZX t), 15 
SIMULA 67, 23, 76~77, 93 
SIMULAI, 76 
Single inheritance (M4k7K), 510, 514~515 
Single-Instruction Multiple-Data (SIMD) ( 单 指名 多 数 
据 ) 557 
Slices ( 片 )，253，271 一 273 
Smalltalk, 91~94 
evaluation of support for OOP (支持 OOP 的 评估 ) , 
518 
inheritance (4kAK), 518 
object-oriented programming (support for) (&##OOP) , 
516~518 
polymorphism (42), 517 
type checking (类 型 检测 ) 517 
SNOBOL, 75~76 
origins and characteristics of (起 源 及 特征 )，76 
SNOBOL 4, 75, 76 
Source language ( 源 语 言 ) 28 
Special variable (特殊 变量 ) 55 
Special words (3k £), 14, 204~205 
Specification packages (iii HH), 475 
Speedcoding (快速 编码 ) 45 
SQL (Structured Query Language) (结构 化 查询 语言 )， 
714 
Stack dynamic arrays ( 栈 动 态 数组 ) 266 
Stack-dynamic local variables ( 栈 动态 局 部 变量 ) 395 
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Stack-dynamic variables ( 栈 动 态 变量 )，216 一 217 


Start symbols (起 始 符号 ) 121 
State diagrams (状态 图 )，171 
Statement-level concurrency (语句 层次 并 发 )， 
Statements (语句 ) 
assignment (RIÉ), 332~337. 另 见 赋值 语句 
assignment (Plankalkiil) (赋值 )，43，58 
break (break 语句) ，352 
case (case 语 句 ) ，79，353 一 354 
control (控制 )，12 一 13，344 
counter controlled loops (计数 器 控制 的 循环 , 
366 
fact (Prolog) (Prolog 的 fact 语 句 ) 694 
foreach (C#) 〈C# 语 言 的 foreach 语 句 ) ，106 一 107 
foreach (Perl) (Perl 语 言 的 foreach 语 句 ) ，84 
goal (Prolog) (Prolog 语 言 的 goal 语 句 ) 690, 696 
guarded commands (守卫 命令 ) 372~376 
if-then-else (if-then-else 语 句 ) 319 
iterative (J&4t), 356~371 
logically controlled loops OZ 43 MIAR), 366 ~ 368 
rules (Prolog) (Prolog 语 言 的 规则 )，694 ~ 695 
selection (3%), 148~149, 346~356 


592 ~ 599 
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switch (Switch 语句 )，351 一 353 
switch (C#) 〈(C#i 滞 言 的 Switch 语句 ) 106, 352~353 
unconditional branch (无 条 件 分 支 )，371 一 372 


State of programs (程序 状态 ) 158 
Static ancestors (静态 祖先 ) 226 
Static arrays (静态 数组 ) 265 
Static binding (FAAEE), 208 
Static chains (静态 链 ) 451~459 
Static-depth (静态 深度 )，454 
Static length strings (静态 长 度 字 符 串 ) ，256 
Static links (静态 链接 ) 451 
Static parents (HAIE), 226 
static (reserved words) (保留 字 static) 216 
Static scope (静态 作用 域 ) 225~231 

evaluation (?Ff4), 229~231 
Static semantics (静态 语义 )，134，135 
Static variables (静态 变量 )，215 一 216 
Steelman document (DoD) (美国 国防 部 铁人 文件 )，88 
Stoneman document (DoD) (美国 国防 部 石 人 文件 )，88 
Storage bindings (存储 器 绑 定 ) 215 
Strawman document (DoD) (美国 国防 部 草 人 文件 )，88 
Strict (严格 的 )，673 
Strings (FFE), 
implementation (实现 )， 
length options (长 度 选 项 )，256 
operations of (1E), 253~256 
Strongly typed languages ( 强 类 型 语 


257 一 258 


言 )，220 


Strong typing ( 强 类 型 化 ) 219~221 
Stroustrup, Bjarne, 94, 478~479 
Structural operational semantics (结构 操作 语义 )， 
Structured Query Language (SQL) (结构 化 查询 语言 
Structures (结构 ) 
of associative arrays (相关 数组 )，280 一 282 
of lists (Prolog) (Prolog 语 言 的 表 )，702 一 707 
Prolog，693 
Structure type equivalence ( 
Subclasses (--2E), 509 
Subgoals ( 子 目 标 ) 696 
Subprogram linkage ( 子 程序 链接 ) 440 
Subprograms ( 子 程序 ) 
active (活动 的 ) 236, 446 
calls (调用 ) 385 
coroutines (协同 程序 ) 431~433 
definitions (定义 )，385 
design issues (设计 同 题 )，394 
displays (显示 )，459 
dynamic scoping (动态 作用 域 )，461 ~ 464 
function design issues (函数 设计 问题 )，429 
functions (Kr), 429~430 
fundamentals of (ZRH), 384~394 
generic (JH FAAY), 394, 422~429 
headers (24), 385 
local referencing environments (局 部 引用 环境 ) 395 
一 397 
nested (RÆKJ), 229, 451~459 
overloaded (H&A), 394, 420~422 
parameter-passing methods (参数 传递 方法 )， 
418 
parameters (参数 ) 397~418 
polymorphic (425A), 422 
procedures (tE), 392~393 
recursion (319), 448~450 
semantics for calls and returns (用 于 调用 与 返回 的 语 
义 )，441 
stack-dynamic local variables ( 栈 动态 局 部 变量 ) ， 
395 
user-defined overloaded operators (用 户 定义 重 载 操 作 
符 )，430 一 431 
Subrange types ( 子 范 围 类 型 ) ，261 一 263 
Subscripts (下 标 )，264 
Substring references ( 子 串 引用 )，253 
Subtypes (FAI), 512~513 
Ada, 262 
Subtypes ( 子 类 型 ) 235, 499 
Sun Microsystems (Sun Microsystems 公 司 ) 98, 101 
Superclasses ( 超 类 )，509 
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Swing package (Java) (Swing 包 (Java)), 631 
switch construct (Switch 结构 )，351 一 353 
switch (C#) (C# 的 Switch) ，106,352 一 353 
Symbolic logic (符号 逻辑 ) 685 
Symbols (符号 ) 另 见 符号 一 节 ，132 
nonterminai ( 非 终 结构 )，120 
start (开始 符 ) 121 
terminal (终结 符 ) 120 
Synchronization (同步 )，560 
threads (C#) (C# 的 线程 )，591 一 592 
Synchronous message passing (同步 消息 传递 ) 571 
Syntax (语法 )，116 一 134 
description of (HÑ), 119~ 131 
Edinburgh, 693 
language evaluation criteria (JAB EF (GEM), 14~15 
lexical analysis (4#), 169~175 
LISP, 53~54 
methods of describing (f#iR AYE), 119~131 
parsing (problem) (问题 的 语法 分 析 ) ，175 一 178. 5 
见 语法 分 析 
recursive-descent parsing (递归 下 降 语法 分 析 ) 179 
一 184 
Synthesized attributes (合成 属性 ) 135 
System Development Corporation (系统 开发 公司 ) 59 
Systems programming (系统 程序 设计 )，6 一 7 
Systems software (系统 软件 )，6 
T 


Tables (Š) 
parsing (语法 分 析 ) 192~ 194 
symbols (符号 ) 28~29 
Tagged types (标志 类 型 ) 535 
Tags (标志 )，288 
XSLT (可 扩展 语言 转换 ) 129 
Task descriptors (任务 描述 符 ) 564 
Task ready queues (任务 就 绪 队 列 ) 562 
Tasks ({£4), 559 
Tasks (termination of) (任务 终止 )，579 
Tel, 83 
Terminal symbols (4247), 120 
terminate (终结 ) 579 
Termination of tasks (任务 终止 )，579 
Terms (Prolog) (Prologi# BAI), 693 
Ternary operators (三 元 操作 符 ) 313 
Testing (pairwise disjointness tests) (两 两 不 相交 测试 ) , 
186 
Theorems (proving) (定理 证 明 ) 688~690 
Thompson, Ken, 81 
Thread class (线程 类 )，583 一 5$85 


Thread of control (控制 线程 ) 558 
Threads (线程 ) 
C#, 590~592 
Java, 583~590 
throws clause (throws 子 句 ) ，625 
Tinman document (DoD) (美国 国防 部 锡 人 文件 )，88 
TIOBE, 3 
Tokens (标记 )，117，171 一 172 
Tombstones (基础 ) 299 
Top-down parsers ( 自 顶 向 下 语法 分 析 器 )，176 一 177 
Top-down resolution (Prolog) (Prolog 语 言 的 自 顶 向 下 
归结 )，697 
Total correctness (总 体 正确 性 )，152 
Traces (parse) (语法 分 析 追 踪 )，182 一 183，195 
Tracing models (追踪 模型 )，701 
Trade-offs (Ff PAK), 25~26 
Transition diagrams ($ RJE), 171~172 
Trees ( 树 ) 
fully attributed (完全 属性 的 ) 136 
parse 〈 语 法 分 析 ) 27, 123~124. 参见 语法 分 析 
Tuples (元 组 )，104 
Turbo Pascal, 80 
Turing Award lecture (Dijkstra) (Dijkstra 的 图 灵 奖 讲座 )， 
74 
Turner, David, 56 
Twos complement notation (两 相互 补 符号 ) 250 
Two-way selection statements (双向 选择 语句 ) ，346 一 
350 
design issues (设计 问题 ) 346 
Type checking (类 型 检测 )，17，219 
and polymorphism (ZÆ), 513~514 
dynamic (动态 的 )，219 
reliability (可 靠 性 )，17 
Smalltalk, $17 
Type-checking parameters (类 型 检测 参数 ) 394 
typedef (C & C++) 〈(C 及 C++ 中 的 保留 字 typedef , 
224 
Type error (类 型 错误 )，219 
Type equivalence (AITE), 221~225 
name (4), 221 
structure (结构 )，221 
Type inference (类 型 推理 )，211，214 
Types (类 型 ) 
binding ( 绑 定 ) 209~211 
byte ( 字 位 、 位 ) ，250 
compatibility (兼容 性 ) 219 
conversions (转换 ) ，324 一 327 
data. See Datatypes (数据 ， 参 见 数据 类 型 ) 
derived (派生 的 )，222 ~ 223 
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enumerated ( 枚 举 的 ) ，258 一 261 
equivalence (等 价 性 ) ，221 一 225 

explicit type conversion ( 显 式 类 型 转换 )，327 
inference (推理 )，211，214 

limited private ( 受 限 私有 )，477 

private (私有 的 )，476 

of returned values (返回 值 的 ) ，429 一 430 
strong typing ( 强 类 型 化 )，219 一 221 
tagged (标志 的 ) 535 

variables (变量 )，207 

wildcard ( 通 配 类 型 ) 428 


U 


Unambiguous grammars 
for expressions 〈 用 于 表达 式 的 非 歧 义 性 文法 ) 126 
一 127 
if-then-else statements (if-then-else 语 句 ) ， 
130 一 131 
Unary assignment operators，334 一 335 
Unary operators (一 元 赋值 操作 符 ) 313 
Unchecked exceptions ( 非 检 测 异 常 )，665 
Unconditional branching (无 条 件 分 支 )，371 一 372 
undef (undefi#‘%)), 85 
Underflow (Pim), 328 
UNICODE (UNICODE), 56, 253 
Unification (4—), 689 
Unions (KA, JF), 286~290 
Ada,288 ~ 290 
discriminated (判别 的 )，288 
evaluation of (评估 )，290 
implementation (实现 ) 290 
UNIVAC (公司 名 ) 45, 56~57, 63 
UNIVAC 1107，45 
UNIVACI (软件 系统 名 ) 44 
UNIVAC Scientific Exchange (USE) (UNIVAC 科 学 交流 
项 目 )，57 
University of Aix-Marseille (Aix-Marseille 大 学 )，86 
University of California at Berkeley (美国 加 州 伯克利 大 
学 ) 83 
University of Edinburgh (美国 爱丁堡 大 学 ) 56 
University of Kent (Canterbury，England) (位 于 美国 
Canterburg 的 Kent 大 学 ) 56 
University of Michigan (美国 密 西 根 大 学 )，59 
University of Utah (美国 犹他 大 学 )，92 
UNIX (UNIX 操 作 系 统 ) ,7.15.33 一 34 
grep command (grep 命 令 )，15 
lint program (lint 程 序 )，17 
unsafe modifiers (unsafe 修 饰 符 )，218 
U.S. Naval Electronics Group (美国 海军 电子 组 织 )，59 
use, 481 


User-defined abstract data types (用 户 定义 抽象 数据 类 
型 )，472 一 473 

User-defined ordinal types (用 户 定 义 的 序数 类 型 ) 258 
~ 263 

User-defined overloaded operators (用 户 定义 的 重 载 操 作 
符 ) ,322~ 324,430 

User-located loop controlled mechanisms (用 户 定 位 的 循 
环 控制 机 制 )，368 一 369 

USE (UNIVAC Scientific Exchange) (UNIVAC 科 学 交流 
HHA), 57 | 

using, 500 


Values ( 值 ) 
aggregate (WE), 269 
computing attribute (计算 属性 )，138 一 139 
I-value ( 左 值 )，206 
precision (精度 )，250 一 251 
returned (types of) (返回 类 型 ) 429~430 
r-value ( 右 值 )，207 
types (类 型 ) 291 
variables (变量 ) 207 
van Rossum, G., 104 

Variables (44), 205 ~207 
addresses (地 址 )，206 一 207 
aliases (别名 )，207 
binding to attributes (属性 绑 定 ) 208 
bound ( 绑 定 ) 651 
class (%), 510 
constrained variant ( 受 限 变 体 ) 288 
declarations (HH), 209~210 
explicit heap-dynamic ( 显 式 的 堆 动 态 )，217 一 218 
heap-dynamic ( 堆 动 态 的 )，217 一 219 
implicit heap-dynamic ( 隐 式 堆 动态 的 )， 
initialization (初始 化 )，238 一 239 
instance (实例 、 范 例 )，510 
lifetime of (生存 期 、 寿 命 )，215 
local (局 部 ) 395 
loop (循环 ) 357 
lost heap-dynamic (丢失 的 堆 动 态 ) 294 
names (名 字 )，206 
scope of (作用 域 ) 225~233 
stack-dynamic ( 栈 动态 的 )，216 一 217 
static (##ASAY), 215~216 
type checking (类 型 检测 )，219 
types (类 型 )，207 
values ( 值 )，207 
Visibility of (可 见 性 )，225 
Variable-size cells (可 变 大 小 单元 )，303 一 304 
VAX (series of superminicomputers) (超级 计算 机 系 
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列 的 VAX 计 算 机 )，10 
VDL (Vienna Definition Language) (Vienna Œ X iE 
B), 142 
Vector processors (矢量 处 理 器 )，557 
Vienna Definition Language (VDL) (VDL 语 言 ) 142 
Virtual method table (vtable) (虚拟 方法 表格 ) 547 
virtual (reserved word) ({R virtual), 527 
Visibility of variables (变量 的 可 见 性 ) 225 
Visual BASIC, 24, 69 
Visual BASIC NET, 24, 69, 105 
von Neumann, John (7% - 诺 依 曼 )，20 
von Neumann architecture (13 - 诺 依 曼 体系 结构 )，20 
~22 
von Neumann bottleneck (5 - ik 243i), 30 
Vtable (virtual method table) (虚拟 方法 表格 ) 547 


W 


Wall, Larry, 84, 364~365, 398 ~399 
Weakest preconditions (最 弱 前 置 条 件 )，144 
Web software (Web 软 件 )，7 

Weinberger, Peter, 83 

Well-definedness (良好 定义 性 )，20 
Wexelblat, Richard, 63, 110 

Wheeler, David, 45 

Whirlwind computer (Whirlwind 计 算 机 )，46 
Widget，630 

Wildcard types ( 通 配 类 型 ) 428 

Wilkes, Maurice V., 45 
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Wirth, Niklaus, 79, 80, 452 ~ 453 
with, 481 
Woodenman document (DoD) (美国 国防 部 本 人 文件 ) ， 
88 
World Wide Web Consortium (W3C) (世界 万 维 网 联盟 ) , 
108 
Writability (可 写 性 ) 15 
expressivity (表达 性 )，16 
reliability (可 靠 性 )，18 
simplicity (简单 性 )，15 
X 


Xerox Palo Alto Research Center (Xerox Palo Alto 研 究 
Huts), 92 

XHTML (eXtensible HTML) (可 扩展 HTML 语 言 ) 24 

XML (eXtensible Markup Language) (可 扩展 标记 语言 )， 
25, 108 

XSLT (eXtensible StyleSheet Language Transformations) 
(可 扩展 语言 转换 )，108 ~ 109 

Y 
yacc (yet another compiler compiler) (yacc 编 译 器 ) 193 
yet another compiler compiler (yacc) ( 另 一 个 yacc 编 译 


a), 193 
yield, 391 


Zuse, Konrad, 40~42 


